生成AIエンジニアLab

生成AIの最新技術を、ハンズオンで解き明かす実践ラボです。
次の一歩を描きながらAI時代のキャリアを模索する羅針盤を目指します。

RAGは、LLMに外部ドキュメントを参照させることで、精度と信頼性を高める代表的なアーキテクチャです。その中核にあるのが「Embeddingモデルを使ったベクトル検索」です。
しかし、Embedding検索は構造的にできない領域があります。

この記事では、OpenAIの最新Embeddingを前提に、RAGにおけるEmbedding検索のできることとできないことを整理します。この記事を読み終えると、Embeddingでどこまで頑張れるのかがイメージできるようになるはずです。

※OpenAI の最新 Embedding(embedding-3 系)は詳細なアーキテクチャ非公開ですが、代表的な研究として、MSMARCOで23.4%改善したcpt-textというモデルがあります。続きを読む

LangGraphは、複数の LLM呼び出しをグラフ構造で管理するためのライブラリです。ノード(関数)とエッジ(遷移条件)を組み合わせて、エージェントの思考フローを明示的に書けるのが特徴です。

Ollamaは、Gemma3などのLLMをローカル環境で簡単に実行できるツールです。従来はOpenAI APIなどのクラウドサービスに依存していたLLMを、完全にオフライン環境で動作させることが可能です。

本記事では、Ollamaで動かすローカルLLMとLangGraphを連携させ、「質問に応じて情報源を選び、最終回答を生成するミニAgent」を作ります。

続きを読む

この記事はパソコンだけで動くAI同士の会話アプリを作りたい人に向けたハンズオン解説です。

関連記事:VOICEVOXをPythonから音声合成する方法(Windows/Mac)

1. どんなアプリを作るの?

キングダムで有名な秦王嬴政と楚の使者の AI が、交互にセリフを言い合います。画面には吹き出しが出て、VoiceVox でセリフが読み上げられます。AI同士で会話をさせ、その様子を見て聞くイメージです。完成した画面は以下になります。
スクリーンショット 2025-04-22 200729続きを読む

本気でAI人材になりたい!高年収で将来性が高いAIエンジニア職に就きたい!

現在の仕事に不満があったり、キャリアの停滞感を感じているなら、このページで紹介する転職サービスは必見です。ここでは、現役のAIエンジニアが市場動向を分析し、使いやすい転職サイト・転職エージェントを厳選してご紹介します。

目次
AI業界の待遇を概観する
生成AI市場の急成長と高値で売れる経験
AIエンジニアは激務なのか
AIエンジニアの将来性

AIエンジニアになるメリット
転職エージェントを活用して効率的に転職しよう
AIエンジニア向け転職エージェント選びのコツ
転職サイト・転職エージェントを利用する時期は?
おすすめの転職サイト・転職エージェント
 「現職ITエンジニアの年収アップをサポート!」TechClipsエージェント
 「ITエンジニアの年収アップと環境改善に強い」 : レバテックキャリア
 「手厚いサポートと情報量で満足度No.1!」 : マイナビIT AGENT
おわりに
続きを読む

未経験からAIエンジニアに就職したい人に向けて、自身の体験談を交えて解説します。

転職エージェントから言われた言葉

新卒で入社した会社で、ずっと企画の仕事をしてきました。
企画職とは、顧客やユーザーにヒアリングして「困ってること」を聞き出し、自社で解決できそうな課題を選んで具体化する仕事です。

「問題発見」と「問題解決」を一緒に行うところがポイントで、いろいろ仮説を立ててひたすらリサーチを繰り返していました。辛い局面もありましたが、好奇心が強い方だったので、新しいことを調べたり新しい人と会うことは楽しかったです。
(某社の2年目社員に完全論破されたり、某社の女性マネージャーに詰められたこともすべて良い思い出です)

続きを読む

「AIを使って稼ぎたい。でも何をやればいいのか分からない…」
そんな悩みを持つあなたに向けて、ローカルLLMを利用した“副業アイデア製造機”を作ってみました。

ローカルLLMには、Gemma3を採用しました。Gemma3は軽量なローカルLLMでありながら、Chatbot Arenaでo1-previewモデルより上位の評価を受けています。人間の評価において、最新のクラウド型モデルと遜色ない会話ができます。また、短いトークン数での文章理解や知識蒸留で工夫されており、メモリ効率が極めて高いことが特徴です。

本アプリは、あなたのパソコン上で、Gemma3モデル2機が、Streamlit上で自動対話させることで、【ひらめき → 深掘り → 要約】をループしながら、アイデアを連続で生み出します

・ネット接続もAPI代も不要。
・自分のPC上で、好きなだけ回せる。
・“副業のタネ”を見つけたら、あとは行動するだけ。

この記事では、副業アイデア製造機の使い方を解説します。

続きを読む

AIエージェント設計とは何か

AIエージェントとは、複雑なタスクや目標を達成するために、「必要な行動を自ら決定し、自ら実行する」システムのことを指します。

たとえばChatGPTも、必要に応じてネット検索を行って回答を生成しますが、企業でAIエージェントを活用する場合には、企業固有の情報を活用できなければ意味がありません。 業務マニュアルを検索したり、データベースを参照したり、業務的な観点で判断して回答することが求められます。

つまり、LLM(大規模言語モデル)を業務用途に特化した応答ができるように設計することがAIエージェントの設計業務です。

続きを読む

RAGの評価フレームワークであるRAGASについて解説します。

RAGシステムの評価は人間の目視評価が主流

従来のRAG(Retrieval-Augmented Generation)システムの評価は、人間の目視評価が主流でした。生成された回答の品質を人間が個別に評価する手法です。しかし、このアプローチにはいくつかの課題があります。

目視評価の課題
・時間とコスト:大量のデータを評価するには多くの時間とコストがかかる
・一貫性の欠如:評価者間の主観的な違いにより、一貫した評価が難しい

これらの課題を解決するために、RAGを自動評価できるRagas(Retrieval augmented generation assessment)が登場しました。
続きを読む

目次
1.AIエンジニアの仕事内容
2.AIエンジニアに向いている人とは?
3.AIエンジニアになるメリットとは
4.AIエンジニアの将来性とは
5.AIエンジニアに必要なスキル
6.AIエンジニアになるための勉強法
7.AIエンジニアになるため大学は必要か
8.AIエンジニアを目指しプログラミングスクールに通うべきか
9.AIエンジニアになる方法はAIエンジニアの仕事をすること
10.AIエンジニアに未経験から転職できるのか?
11.AIエンジニアの求人と選び方
12.AIエンジニアの採用は2025年度から本格化
13.AIエンジニアにおすすめの転職エージェント
14.AIエンジニアになる3ステップ
さいごに

続きを読む

本記事では、Azure AI Document IntelligenceとLangChainを活用したRAG(Retrieval-Augmented Generation)の構築手順を解説します。
特に、AI Document IntelligenceによるドキュメントのMarkdown変換と、LangChainを用いたチャンク分割の方法をご紹介します。

Azure AI Document Intelligenceとは

Azure Document Inteligenceとは、pdf や画像ファイルから情報抽出するOCRサービスです。取得可能な情報として、テキスト、テーブル、段落、座標、レイアウト情報を抽出できます。一般的な文章の文字起こしや、領収書や請求書などの読み取りなど様々なデータの処理が可能です。

様々な事前学習済みのモデルが提供されており、例えばLayoutモデルを用いると、文書構造(レイアウト情報)を保ったまま、Markdown の形式で抽出することが可能です。
Markdown の形式で抽出し、#、##等の見出しで分割することで、セマンティックチャンキングが可能となります。

続きを読む

↑このページのトップヘ