2024.05.10 18:10Nation

「富岳」で生成AI基盤完成 日本語能力に特化―東工大・富士通など

 東京工業大や富士通などは10日、スーパーコンピューター「富岳」を活用し、文章などを自動で作る生成AI(人工知能)の基盤となる大規模言語モデル「Fugaku―LLM」を開発したと発表した。学習データの多くに日本語を用いており、国内のニーズに合わせた生成AIの研究につながることが期待される。
 富岳を使った開発は2023年5月から開始され、東北大や名古屋大、理化学研究所なども参加した。学習データの約6割が日本語で、松尾芭蕉の俳句に関する質問にも流ちょうに回答できるなど、日本語能力に特化している点が特徴だ。
 こうしたデータは開発に当たって独自に収集したもので、有害な文言をあらかじめ排除するなどした。このため学習の全過程を把握でき、海外のモデルと比べて透明性と安全性が向上したという。(2024/05/10-18:10)

2024.05.10 18:10Nation

Japan Team Develops AI Foundation with Fugaku Supercomputer


A team of researchers from the Tokyo Institute of Technology, Fujitsu Ltd. and others said Friday they have developed a large language model that can serve as a foundation for generative artificial intelligence, using the Japanese supercomputer Fugaku.
   Trained extensively on data in Japanese, which account for 60 pct of the total training data, the Fugaku-LLM model is expected to lead to research on generative AI tailored to domestic needs.
   The researchers, also including those from Tohoku University, Nagoya University, the government-backed research institute Riken, CyberAgent Inc. and Kotoba Technologies Inc., launched in May 2023 the project employing the supercomputer jointly developed by Fujitsu and Riken.
   Fugaku-LLM's high Japanese language ability can be demonstrated when it answers questions about poems by haiku master Matsuo Basho fluently, they said.
   Unlike most other models with Japanese language capabilities, which employ continual learning, Fugaku-LLM is trained from scratch using the team's own data that do not contain harmful ones so the entire learning process can be understood, they said, adding that it is superior in terms of transparency and safety.

最新ニュース

写真特集

最新動画