画像処理 New!! PythonのOCR(光学文字認識)で『SPY×FAMILY謎解き』の謎解きに挑戦 AI要約PythonのOCRライブラリを使い、『SPY×FAMILY謎解き』の画像から文字情報を抽出し謎解きに挑戦しました。Tesseractの設定や実行結果も詳細に解説しています。やることこんにちは... 2025/04/29 Suzu 画像処理
画像処理 プラレールにARマーカーを付けて動画検出 AI要約プラレールの電車にARマーカーを貼り付け、OpenCVを使って動画内で位置検出に挑戦しました。リアルタイム検出のためにはカメラの設定も重要です。自由研究にも最適な内容です。やること「プラレール... 2025/04/05 Yasuda 画像処理
音声処理 31-4. Pythonで音声ファイルを再生する やること以前、音声会話できるRAGチャットシステムを作りました。そのときに使った技術のおさらいになりますが、Pythonで音声ファイルを再生する方法を紹介します。準備simpleaudioというパッケ... 2024/12/03 Yasuda 音声処理
画像処理 16-42. パリピ孔明のアニメに出てきたQRコードが間違っている件 やることパリピ孔明のアニメを見ていたら、QRコードを使ったメタ広告が登場しました。アクセスしたら公式の思う壺だなと思いつつスマホで読み取って見ると、なんと埋め込まれているテキストが誤っていて、意図した... 2024/10/05 Suzu 画像処理
音声処理 31-3. ウマ娘の声をフーリエ変換して比較してみた(③類似度編) やることウマ娘の声をフーリエ変換して比較する、の最終回です。前回はFFT画像の準備をしました。いよいよ音声の定量比較です。ポジティブコントロールとネガティブコントロールも用意しているので実験設計の参考... 2024/08/11 Suzu 音声処理
音声処理 31-2. ウマ娘の声をフーリエ変換して比較してみた(②フーリエ変換編) やることこんにちは、Suzuです。前回はモノマネをしているウマ娘声優さんの声をフーリエ変換しました。ここからはスペクトログラムの定量比較を行います!前回の題材のままではやりにくいので、新しい題材として... 2024/08/11 Suzu 音声処理
画像処理 14-36. グラフ画像から数値データをリバースエンジニアリングする やること自治体さんから緊急の依頼がありました。PDFで保存さているグラフ画像を大至急、数値データに戻してほしいとのことです。こんな感じのPDF画像が大量に送られてきました (゚д゚; )アレマー古典的... 2024/08/10 Yasuda 画像処理
画像処理 14-35. 【ほこ×たて】ミュラーリヤー錯視 vs フィック錯視 やること昔、楚の国の人でミュラーリヤー錯視とフィック錯視を売る者がいた。この人はミュラーリヤー錯視を誉めて「横線の長さは同じだが、Y字になっている方が長く見える」と言った。また、フィック錯視を誉めて「... 2024/07/02 Yasuda 画像処理
画像処理 14-34. ImageJでチェッカーシャドー錯視を考察する やることチェッカーシャドー錯視はご存知でしょうか。画像のAとBのタイルの色はまったく同じなのだそうです Σ(゚ロ゚;)ハウア出典:Wikipedia「チェッカーシャドー錯視」まあ睨んでいても日が暮れる... 2024/06/24 Yasuda 画像処理
音声処理 31-1. ウマ娘の声をフーリエ変換して比較してみた(①準備編) やることこんにちは、生粋のウマ娘ファンです|・ω・)ノ2021年に公開した「画像のフーリエ変換」の記事がロングセラーになっています。とても分かりやすい記事です(感嘆)で本題なのですが、Youtubeに... 2024/06/20 Suzu 音声処理