Prediction Oneに学習させるデータの準備
ナンバーズやロトなどの数字選択式宝くじにおいて、数字の出方に何か法則性があるのでは…?と考えたことがある方もいらっしゃるのではないでしょうか。
今回はSONY製の予測ツール『Prediction One』を用いて、ナンバーズの過去の結果から、当せん番号の予測をしてみようと思います。
Prediction Oneの概要等は以下の記事をご参照ください。
また、ナンバーズの当せんパターンと当せん金額については、公式サイトをご参照ください。
ナンバーズ3の場合、以下のような感じですね。
尚、過去データはジャパンネット銀行さんの「当せん番号の分析」ページより、ナンバーズ3の直近約1年分のデータをCSVでダウンロードします。
データは上記のような感じ。回号、抽せん日、曜日、抽せん数字、各タイプごとの当せん金額・当せん口数です。
今回は、日付と抽せん数字だけあれば良いので、2列だけ使います。
データは、2019/01/01~2019/12/31の結果を訓練データ、2020/01/01~2020/01/31の結果をテストデータとして分けて用いることにします。
ナンバーズの当選番号を予測させてみる
時系列予測
さて、まずは時系列予測してみます。
Prediction Oneを起動し、先ほどのCSVファイル(2019/01/01~2019/12/31に期間絞ったもの)を読み込ませます。
[時系列予測モードを使用]にチェックを入れ、[予測ターゲット]は抽せん数字、[予測ターゲットの時間情報]は抽せん日とします。
設定出来たら、[次へ]。
ナンバーズ3なので、当然ですが000~999の間でプロットされていきます。
今回は、1月末まで予測させたいので、[32日先まで]として、[学習と評価を実行]。
1分もかからず学習が終わりました。
精度は☆2つ半で、中程度との評価。
なんとなくですが、1つの数字として予測させるのではなく、数字を1桁ずつ分けた方が良さそうですね。
1桁目だけ抜き出して学習し直した結果が以下の通り。
まだ中程度…。むしろ若干誤差率大きくなってますね。
特に時系列の傾向がなく、数値の大小で見てしまうと、予測誤差を少なくするために中央値に近い数値を予測しがちなのは妥当な気がしますね。
テストデータとして確保しておいた2020/01/01~2020/01/31のデータで、1桁目の予測について答え合わせをしてみます。
うーん、なかなか難しいですね。
数値予測
ならばということで、数値予測も試してみます。
日付しかインプットがないので厳しいような気がしますが…。
ですよね…という結果に。
項目としてこれに追加するなら、回号・曜日やら環境の情報(天気・気温・湿度)やら場所情報(東京 or 大阪)…などでしょうか。結果に影響があるかは別にして…。
完全確率抽せんなので難易度が高いのは当たり前ですが、少しでも影響がありそう且つ抽せん前に分かる要素が少なめなので数値予測のほうも更に難しくなりますね。
まとめ
今回は、Prediction Oneでナンバーズの当せん番号を予測してみました。
時系列予測では目立った傾向は見つけられず良い予測にはなりませんでした。
数値予測としても、もう少しインプットが欲しいところ。何か良いインプットが思い付いたら、またリベンジ記事を書きます。
それでは、また次回!
平成生まれのアラサー文系ぽんこつシステムエンジニア。
エンジニアらしく技術系の記事を書いたり、全く関係ない記事を書いたり、まったりやっていきたいです。
AI(人工知能)、デジタルマーケティング、DX、Office365活用、ガジェットなどに興味があります。
コメント