タイSCB 10X、イサーン語AIモデル発表 ~Typhoon Isanで2,000万人のデジタル参加実現~

タイSCB 10X、イサーン語AIモデル発表 ~Typhoon Isanで2,000万人のデジタル参加実現~ AI
AI

タイの金融テクノロジー大手SCB 10Xが2025年11月27日、イサーン語に特化したAIモデル「Typhoon Isan」を発表した。イサーン語はタイ東北部で話される方言で、約2,000万人が使用している。今回の発表は、標準タイ語を話せない地方住民のデジタル参加を可能にする重要な一歩となる。

初の体系的イサーン語AIモデル

Typhoon Isanは、イサーン語に対応した初の体系的な自動音声認識(ASR)モデルである。プロジェクトは3つの成果物で構成されている。

第一に、イサーン語の音声を高精度でテキストに変換するオープンソースのASRモデル。第二に、口承で伝えられてきた方言に対する標準書記法「イサーン語正書法」。第三に、音声コーパスと発音辞書のオープンデータセット。

SCB 10Xはこれらをオープンソース化し、外部開発者によるアプリケーション開発を促している。

Geminiを上回る認識精度

Typhoon Isan ASRの性能は、文字誤り率(CER)で0.0885を達成した。GoogleのGemini-2.5-pro(CER 0.1020)を上回る精度である。

リアルタイム処理に最適化された「Typhoon Isan ASR Realtime」も提供している。CER 0.1065で、ボイスボットやリアルタイム翻訳などのライブアプリケーションに適している。

正書法の策定が最大のハードル

イサーン語のASR開発における最大の課題は、標準化された書き言葉が存在しなかったことである。同じ単語でも転写者によって異なる表記がなされていた。

SCB 10Xは言語学者、コミュニティ、教師と協力し、イサーン語正書法を策定した。タイ文字に基づき、イサーン語の音素を一貫して表現するシステムである。口頭媒体であった言語を、デジタル・テキスト媒体へと変換するインフラを構築したことになる。

1,800億バーツ経済圏のデジタル化

イサーン地方は人口約2,000万人、GDP1,800億バーツ超(国家経済の約10%)を占める。

従来のバンキングアプリは標準タイ語での読み書きを要求する。高齢者や識字レベルの低い層にとって大きな障壁だ。タイの調査では、国民の74.1%が標準以下のデジタルスキルしか持っていない。

Typhoon Isanを活用した「ボイスファースト」インターフェースにより、イサーン語で話しかけるだけで取引が可能になる。母語で話すことは信頼を醸成する。遠いバンコクの大企業ではなく、地元の支店長のように感じられる効果がある。

医療現場での応用

タイ東北部の医療現場では、中央タイ語を話す医師とイサーン語を話す患者の間に深刻なコミュニケーション断絶が存在する。言語の壁は誤診や不適切な治療に直結している。

Typhoon Isan ASR Realtimeは、患者のイサーン語の音声を即座に標準タイ語のテキストに変換し、医師に提示できる。遠隔地の高齢者がAIトリアージボットに症状を話しかけ、AIが要約を医師に送信するフローも可能になる。

メリオイドーシス(類鼻疽:東北部で一般的な感染症)のような風土病の流行時、標準語の警告は無視されがちだ。地元の言葉で語りかけるAIは、予防行動を促す上で効果的である。

今後の展望

Typhoon Isanは、より広範な「Typhoon」AIモデルファミリーの一部である。SCB 10XはこれまでにTyphoon 1.5および2.0をリリースしており、タイ語において高いパフォーマンスを示している。

ロードマップにはTyphoon 2.5とマルチモーダル機能(テキスト、画像、音声)の統合が含まれている。イサーン語モデルの成功は、カム・ムアン(北部)やパク・タイ(南部)といった他の方言への展開の土台となる。

BKK IT Newsとしては、このアプローチが他のASEAN諸国にも広がる可能性があると見ている。各国には独自の地域方言が存在し、同様のデジタル疎外が生じているためである。

参考記事リンク