生成AIエンジニアLab

生成AIの最新技術を、ハンズオンで解き明かす実践ラボです。
次の一歩を描きながらAI時代のキャリアを模索する羅針盤を目指します。

カテゴリ: 生成AI

RAGの実装において、「検索精度の頭打ち」と「情報の鮮度・権限管理」は大きな課題です。
単一のベクトル検索だけでは、文脈が不足したチャンクを取り違えたり、権限外のドキュメントを参照したりするリスクがあります。
本記事では、この課題を解決するためのデータ構造設計(メタデータ設計)を解説します。

なぜメタデータ設計が必要なのか

RAGはドキュメントをチャンク分割して、ベクトル検索することが基本ですが、そもそも検索対象のドキュメントに新版と旧版が混ざっていたり、似たようなドキュメントがあると、ベクトル検索で意味の近いチャンクをとってきたときに、正しい検索結果にならないケースがあります。そのため、メタデータを利用して、検索前に事前に検索対象のドキュメントを絞り込んでしまいたいというモチベーションがあります。

そこで、メタデータ設計です。文書本文とは別に付与する、検索制御用の属性情報を指します。具体的には、会社名、年月、ドキュメント種別などです。メタデータで検索対象となる文書群を限定することで、検索精度を高める狙いです。

続きを読む

PDFファイルを参照するRAGシステムを構築する場合、PDFの前処理は重要です。その後のチャンク設計や検索品質に直結します。

一方でドキュメントの前処理の選択肢は急速に増えています。テキスト抽出、Doclingのような変換ツール、さらにLLMやVLMがPDFを直接解釈し、Markdownに変換するパターンも現実的な選択肢になっています。

そこで本記事では、READocの論文を参考に、RAG用途のPDF前処理の視点で代表的なツールを比較し、2025年時点での使い分けの指針を整理します。
続きを読む

業務向けAIエージェント構築で、社内のデータベースを検索させたり、外部ツールを使う開発が増えています。
MCPという新しい規格の登場で、この開発のやり方が簡単になりつつあります。この記事では、MCPの基本から、MCPサーバーを利用したAIエージェントの構成例を解説します。

MCP(Model Context Protocol)とは?

MCPは、一言でいうと「LLM専用の、外部ツールや社内データへの安全なアクセスを標準化する規格」です。 今まで人間やWebアプリ向けに使われてきた「FastAPI」などのWeb APIとは違い、最初から「LLMが自分で理解して使うこと」を目的に作られています。



続きを読む

この記事はパソコンだけで動くAI同士の会話アプリを作りたい人に向けたハンズオン解説です。

関連記事:VOICEVOXをPythonから音声合成する方法(Windows/Mac)

1. どんなアプリを作るの?

キングダムで有名な秦王嬴政と楚の使者の AI が、交互にセリフを言い合います。画面には吹き出しが出て、VoiceVox でセリフが読み上げられます。AI同士で会話をさせ、その様子を見て聞くイメージです。完成した画面は以下になります。
スクリーンショット 2025-04-22 200729続きを読む

生成AIの普及は、エンジニアのキャリア市場を大きく揺るがしています。
「自分の仕事がAIに置き換えられるのではないか」
「これまで積み上げてきた経験が無駄になるのではないか」

特にフロントエンド開発や運用保守など、生成AIへの代替可能性が高い業務に従事しているエンジニアにとって、この不安は現実味を帯びています。

コード補完や自動化が当たり前になった時代、価値が集まるのは、「どの技術を学び、どんな環境で経験を積むかを見極める判断力」や「過去の経験を次の成長に結びつける力」です。
そのため、転職エージェントを選ぶ際も、従来の「年収アップ」や「今のスキルに合う求人があるか」だけでは不十分で、長期的にキャリアを伸ばせる環境を提示できるかどうかが重要になります。

本記事では、現役の生成AIエンジニアが、生成AI時代に通用する転職エージェント選び方を解説します。

※本記事には、マイナビのプロモーションを含みます。

結論(転職エージェントを選ぶ方程式)

 転職エージェントの価値 = 誠実さ × 求人数 
続きを読む

↑このページのトップヘ