俺人〜OREGIN〜俺、バカだから人工知能に代わりに頑張ってもらうまでのお話

このブログでは人工知能(AI)の多角的な側面を深く掘り下げ、その理論と実践の両面を探求していきます。データから知見を引き出す手法の解説に加え、AIが社会に与える影響や、健全な発展に向けたガバナンスの重要性にも焦点を当てます。視覚情報や言語情報、その他の多様なデータを活用した予測モデルの構築を通じて、AIがどのように現実世界の問題解決に貢献できるかを調査・発信していきたいと思います。

LLM

2025年上半期のAIによる脅威動向:AIが加速させるサイバー脅威の進化とAIマルウェア「LameHug」の衝撃

2025年上半期のサイバー脅威について調査してみました。昨今は、攻撃者が人工知能(AI)を積極的に活用し、その手口を多様化させていることで、これまで以上に動的かつ危険なものとなっています。また、AIを基盤とした初のマルウェアとされる「LameHug」の登…

「2024 NIST GenAI (Pilot Study): Text-to-Text Evaluation Overview and Resultsを読み解く:AI生成テキスト検出の現在と今後

今回は、2025年6月25日に公開された2024 NIST Generative AI (GenAI) Pilot Study: Text-to-Text Evaluation Overview and Resultsを拝読し、自分なりの理解を整理しました。 この研究は、テキストからテキストへ(T2T)の生成および識別タスクの評価に焦点…

プロンプトインジェクション対策のテスト手法について調べてみました:LLMアプリの盾を試験する

近年、LLM(大規模言語モデル)を組み込んだアプリケーション開発に挑戦する中で、その安全性確保、特に「プロンプトインジェクション」という脅威への対策は避けては通れない課題だと感じています。どれだけ巧妙な防御策を講じても、その防御策が本当に機能…

「MULTILINGUAL JOINT TESTING EXERCISE」~LLM多言語評価手法の改善に向けた共同試験の結果~を読み解く:グローバルなAI開発の課題と今後の展望

AIの進化、特に大規模言語モデル(LLM)の発展は目覚ましいものがあります。今回は、AI安全機関(AISIs)と各国政府機関が共同で実施した、LLMの多言語環境における安全性評価に関するレポートを読み解き、そこから得られた知見を自身の学びとして整理しまし…

「AIセーフティに関する評価観点ガイド(第1.10版)」を読み解く:AIセーフティの羅針盤

今回は、AI開発・提供の指針となる「AIセーフティに関する評価観点ガイド(第1.10版)」に注目し、その内容を自身へのインプットとして整理してみました。 aisi.go.jp 資料の目的と背景 使用されている用語 想定読者 AIセーフティ評価の目的と重要要素 AIセ…

「観光地・観光産業の生成AIの適切な活用に向けて」を読み解く:生成AIは観光産業をどう変えるか

今回は観光庁が公開した、観光分野における生成AIの活用に関する「観光地・観光産業の生成AIの適切な活用に向けて」を読み解きます。「適切な活用」「効果的な活用」、そして詳細な「実証結果」という3つの視点から、観光DXの未来像と、課題と可能性について…

産総研「生成AI品質マネジメントガイドライン第1版」の概要:生成AI活用の品質確保に向けた新たな道しるべ

今回は、産業技術総合研究所より先日公開された、「生成AI品質マネジメントガイドライン第1版」の概要を整理しました。 www.aist.go.jp www.digiarc.aist.go.jp 産総研による「生成AI品質マネジメントガイドライン 第1版」 品質管理の具体的なアプローチ 将…