オンプレミス生成AIの決定版!Nutanix GPT-in-a-Box 2.0をCisco UCSで動かしてみた!
シスコシステムズ合同会社
クラウド・AIインフラストラクチャ事業
ソリューションズエンジニアリング部
シニアソリューションズエンジニア
加藤 久慶様
◇講演概要◇
今後増えると予想されるオンプレミスの生成AI基盤について、弊社ではNutanix GPT-in-a-Box 2.0ベースの事前検証済デザインガイド(CVD:Cisco Validaded Design)をリリースさせて頂きました。このCVDには、AIの精度を向上させるためにRAG(Retrieval-Augmented Generation:検索拡張生成)の仕組みを取り入れたデザインガイドとなっており、本講演では、RAGの説明およびインフラとその上で動くソフトウェアスタックを含めたデザインガイドについて解説させて頂きます。