理論 5-15. テキストの特徴を表すTF-IDFとは何か?(東大寺の大仏 vs 高徳院の大仏) 概要TF-IDFは文書内の各単語の重要度を表す指標で、文書の特徴を掴む手助けになります。自然言語処理や機械学習の前処理として使われることがあります。ざっくりというと、TF-IDFは文字の通りTFとID... 2022/03/22 Taniguchi 理論
理論 5-14. ジェンダーギャップ指数を偏差値で再計算すると日本は何位なのか? やること最近、ジェンダーギャップ指数という単語をよく聞くようになりました。スイスの世界経済フォーラム(World Economic Forum : WEF)が毎年公表しており、各国の男女格差を数値化し... 2022/01/24 Yasuda 理論
理論 5-13. 秘伝のタレと指数平滑法の話 やること「250年継ぎ足した秘伝のタレ」に過去のタレ成分がどれくらい残っているか計算したテレビ番組がありました。TBS『この差って何ですか?』2019年8月13日放送回30Lの甕(かめ)から毎日1L使... 2021/12/06 Yasuda 理論
理論 29-3. 論理プログラミング言語「Prolog」(その3:グラコロバーガーの合成で学ぶ探索の基本形) 概要前回まではPrologをPythonで再現しながら学んでいましたが、早くもPythonでの再現を諦めました。今回はPrologで探索を学びます。参考文献Ivan Bratko(著)、安部憲広(翻訳... 2021/12/01 Yasuda 理論
理論 29-2. 論理プログラミング言語「Prolog」(その2:ルールをPythonで再現してみた) 概要PrologをPythonで再現しながら学んでいきます。内容もプログラムも前回の続きです。参考文献こちらの参考書の例題を踏襲しています。Ivan Bratko(著)、安部憲広(翻訳)『Prolog... 2021/11/29 Yasuda 理論
理論 29-1. 論理プログラミング言語「Prolog」(その1:ファクトとクエリをPythonで再現してみた) 概要Prolog(ぷろろぐ)は論理プログラミング言語の一つで、データの性質や関係を「命題」として記述することで、問い合わせに対して論理的な答えを導き出してくれます。例えば、ピチューの進化後はピカチュウ... 2021/11/27 Yasuda 理論
理論 5-11. レコメンドシステムではなぜユークリッド距離ではなくコサイン類似度が用いられるのか 概要2つのデータがどれくらい似ているかを知るには「距離」を調べます。ユークリッド距離はもっとも基本的な距離の一つです。一方でコサイン類似度というものもあり、レコメンドシステムや機械学習アルゴリズムにお... 2021/09/05 Taniguchi 理論
理論 5-10. マッチ棒クイズの自動生成 やることマッチ棒クイズ(マッチ棒パズル)はご存知でしょうか。「マッチ棒を1本動かして式を完成させてください」といった問題です。もっとも基本的なものは1桁の足し算・引き算です。問題答え掛け算・割り算もあ... 2021/03/25 Yasuda 理論
理論 16-16. ポケモンの高さと重さを調べてみたら何かおかしかった やること『ポケットモンスター Let's Go! ピカチュウ』皆さんはやっていますでしょうか。私は色違いポケモンが欲しくて、いつのまにか大量にポケモンを捕まえていました。ピカブイ版では連続で捕獲するこ... 2020/11/19 Taniguchi 理論
予測 / クラス分類 5-9. 多項式近似や深層学習よりも数理モデルが適している例 やること「Deepでポン」という表現を耳にしました。調べても定義が見つからなかったので私なりに定義してみます(間違っていたらご指摘ください・・・)。「Deepでポン」は「とりあえずDeep Learn... 2020/09/08 Yasuda 予測 / クラス分類理論