タイがタイ語AI「ThaiLLM」発表海外依存脱却、データ主権、LANTAスパコン学習

タイ高等教育省(MHESI)とDE省が5/5、共同で「ThaiLLM」(タイ語大規模AI)プロジェクトを発表。NECTECのLANTAスパコンで学習し、海外技術依存削減+データ主権保護+タイ語方言対応を実現。これまで人材700人を育成済み。

タイの高等教育・科学・研究・イノベーション省(MHESI/อว.)とデジタル経済社会省(DE)が5月5日、共同でタイ語に特化した大規模言語モデル(LLM)「ThaiLLM」プロジェクトの正式発表会を開いた。海外製AIへの依存削減、国家データの主権保護、そしてタイ語の方言や独特の文化的文脈への対応を3本柱とする戦略的プロジェクトとして位置づけられた。

プロジェクトには国家電子・計算機センター(NECTEC)、国家科学技術開発庁(NSTDA/สวทช.)、ヴィットシリメティ大学(VISTEC)、タイAI事業者協会(AIAT)、AI企業者協会(AIEAT)、ビッグデータ機関(BDI)が参加する。記者会見にはMHESI大臣官房のチャトリン・チャンホーム氏、副次官のパンプムサック・アルニー博士、DE省次官のパチョン・アナンタシン氏、BDI所長のティーラニー・アジャラクル教授らが出席し、官民横断の体制であることを強調した。

MHESIが担う3つの役割が示された。第一にLANTAスーパーコンピュータの提供である。NECTECが運用する高性能計算機を使ってThaiLLMの学習を行うことで、海外のクラウドサービスを使うのに比べて時間とコストを大幅に節約しつつ、学習に使うデータが国外に出ないという主権面での優位を確保する。第二に研究者・専門家のリソース提供で、モデル設計から学習データセット構築、評価・品質改善までを国内チームでカバーする。第三にAI人材の育成カリキュラム開発と研修実施である。

人材育成は既に4つのコースで進行中で、AI Beginner(初学者)、AI Engineer(LLM調整・RAG構築ができる開発者)、AI Professional(実務適用)、AI Researcher(研究者)の4階層をカバーする。これまでの累計参加者は700人を超え、政府はこの層を中核としてタイ国内のAIエコシステムを継続的に強化する方針である。

副次官のパンプムサック氏は「現代においてAIは選択肢ではなく『生き残るための道』」と強調し、ThaiLLMが医療、教育、観光、スマート農業といった幅広い領域で新産業やスタートアップを生む基盤となることを期待すると述べた。海外製のChatGPTやGeminiなどのLLMがタイ語の方言、専門用語、文化的ニュアンスに対応しきれない場面が多いことを踏まえると、国内モデル開発はタイ独自のIT政策の中核を担う位置づけになる。