Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門

購入した作品の読み方

あらすじ

最新のマルチモーダルAIをアプリやサービスで活用する!

「Gemini」は、Googleが開発した最新の生成AIで、本書では2024年5月の正式版リリース「Gemini 1.5 Pro」「Gemini 1.5 Flash」にも対応しています。

Geminiは、OpenAIの最新モデル「GPT-4o」に対して、現時点でテキストや画像だけでなく「動画」「音声」が一般ユーザーでも扱える「マルチモーダルAI」であることが大きな特徴です。また、Android端末やiPhoneなどのエッジデバイスに対応した「Gemini Nano」も公開されています。

本書は、Geminiの「API」を使うことでカスタマイズしたチャットAIを自社のサービスやアプリに組み込むための方法をステップ・バイ・ステップで解説した書籍です。
プログラミングは、Google Colabを使ってPythonのコーディングで行うことができるほか、スマホアプリの開発で使われる「Andorid Studio」や「Xcode」の開発環境でも行うことが可能です。

また、定番のAI開発フレームワーク「LlamaIndex」と「LangChain」の最新版の解説も解説しました。これらを使うことで、より高度なアプリ開発を容易に行うことが可能になります。