【LLaMA】Metaが公開した次世代の大規模言語モデル
2023-09-04
2024-08-13
LLaMAとは?
LLaMA(Large Language Model Meta AI)は、Meta AIが2023年2月に公開した大規模言語モデルです。このモデルは、7Bから65Bのパラメーター範囲で提供されており、特に13Bパラメーターモデルは、多くのNLPベンチマークでGPT-3(175Bパラメーター)を上回るパフォーマンスを示しています。
LLaMAの特徴
- 多様なモデルサイズ
LLaMAは、7B、13B、33B、65Bという4つの異なるモデルサイズで訓練されています。 - 高性能
13Bパラメーターモデルは、GPT-3を上回る性能を持ち、最大のモデルは、PaLMやChinchillaなどの最先端のモデルと競合する性能を持っています。 - 公開の背景
Metaのオープンサイエンスへの取り組みの一環として、LLaMAが公開されました。
LLaMA 2の紹介
2023年7月には、LLaMAの次世代モデルである「Llama 2」が公開されました。このモデルは、研究および商用利用のために無料で提供されています。
コードLLaMAの登場
2023年8月には、「Code Llama」というAIモデルも公開されました。これは、LLaMA 2をベースにしており、コードの生成や議論のために微調整されています。
まとめ
「LLaMA」および「LLaMA 2」は、Metaが公開した大規模言語モデルの新しいシリーズであり、NLPの分野での最先端の技術を持っています。これらのモデルは、多くの応用分野での使用が期待されています。