- HOME >
- Jamstack用語集 >
- OpenAI
OpenAI
オープンAI
OpenAI とは
OpenAI(オープン AI)は、2015年に設立された AI 研究企業です。「すべての人類に利益をもたらす AGI(汎用人工知能)の実現」をミッションに掲げています。
ChatGPT の成功により、AI を一般に広く普及させた企業として知られています。GPT-4、DALL-E 3、Whisper など、革新的な AI モデルを次々と発表し、AI 業界の最前線を走り続けています。
OpenAI の創業
OpenAI は、シリコンバレーの著名な起業家や投資家たちによって設立されました。
創業メンバー
- Sam Altman: Y Combinator の元社長、現 OpenAI CEO
- Elon Musk: Tesla、SpaceX 創業者(2018年に退任)
- Greg Brockman: Stripe の元 CTO、現 OpenAI 社長
- Ilya Sutskever: Google Brain の研究者、現 OpenAI 共同創業者
- Wojciech Zaremba: Google Brain、Facebook AI Research の研究者
- John Schulman: UC Berkeley の博士課程出身
創業時の理念
OpenAI は非営利団体として出発しました。
創業宣言(2015年):
「AGI は人類にとって最も重要な技術になる可能性がある。
しかし、その開発は慎重に行われるべきだ。
私たちは AGI を安全に開発し、その利益を全人類に広く分配する」
初期投資: $1B の寄付を目標(Elon Musk、Sam Altman など)OpenAI の組織変革
OpenAI は、その歴史の中で大きな組織変革を経験しています。
2019年: 営利部門の設立
AGI 開発には膨大な資金が必要だと認識し、「capped-profit」モデルを導入しました。
capped-profit モデル:
- 投資家へのリターンに上限を設定(100倍まで)
- 超過利益は非営利部門に還元
- AGI が実現した場合、その利益は全人類のものとする
目的:
膨大な資金を調達しつつ、営利企業の短期的な利益追求を避けるMicrosoft との戦略的パートナーシップ
2019年: Microsoft が $1B 投資
2023年: Microsoft が追加で $10B 投資(評価額 $29B)
パートナーシップの内容:
- Azure 上で OpenAI のモデルを訓練
- Microsoft 製品への OpenAI 技術の統合
- OpenAI API の独占的クラウドプロバイダー2023年11月: 経営陣の混乱
Sam Altman CEO が一時的に解任され、5日後に復帰するという出来事が起きました。
経緯:
- 取締役会が Sam Altman を解任
- 従業員の 95% が Altman の復帰を要求
- Microsoft が Altman を受け入れる姿勢を表明
- 最終的に Altman が CEO に復帰
この出来事は、AI 開発における安全性と商業化のバランスを
めぐる内部対立を浮き彫りにしたOpenAI の主要プロダクト
OpenAI は、様々な革新的なプロダクトを開発しています。
GPT シリーズ(言語モデル)
| モデル | リリース | パラメータ数 | 特徴 |
|---|---|---|---|
| GPT-1 | 2018年6月 | 117M | Transformer ベースの最初のモデル |
| GPT-2 | 2019年2月 | 1.5B | 高品質なテキスト生成、段階的公開 |
| GPT-3 | 2020年6月 | 175B | Few-shot learning の実現 |
| GPT-3.5 | 2022年3月 | 不明 | ChatGPT のベース |
| GPT-4 | 2023年3月 | 不明(推定1T+) | マルチモーダル、人間レベルの性能 |
| GPT-4 Turbo | 2023年11月 | 不明 | 128K コンテキスト、コスト削減 |
| GPT-4o | 2024年5月 | 不明 | 音声・画像・テキストのネイティブ統合 |
ChatGPT
2022年11月にリリースされた対話型 AI です。
成長の記録:
- リリース5日で 100万ユーザー
- 2ヶ月で 1億ユーザー(史上最速)
- 2024年時点で 2億以上の週間アクティブユーザー
インパクト:
- AI を一般に広く普及させた
- 「AI ブーム」の火付け役
- 教育、ビジネス、クリエイティブ分野で広く利用されるDALL-E シリーズ(画像生成)
テキストから画像を生成する AI モデルです。
DALL-E 1(2021年1月):
- テキストから画像を生成する革新的な技術
DALL-E 2(2022年4月):
- 高解像度化、より自然な画像生成
- インペインティング(画像の一部を編集)
DALL-E 3(2023年10月):
- ChatGPT との統合
- プロンプトの理解力が大幅に向上
- 安全性の強化Whisper(音声認識)
多言語対応の音声認識モデルです。
特徴:
- 99言語対応
- 高精度な文字起こし
- 翻訳機能
- オープンソースで公開
用途:
- 会議の文字起こし
- 字幕生成
- 多言語翻訳Codex / GitHub Copilot
コード生成に特化した AI です。
Codex:
- GPT-3 をコード生成に特化させたモデル
- 自然言語からコードを生成
GitHub Copilot:
- Codex をベースにした開発ツール
- エディタ内でリアルタイムにコードを提案
- 数百万人の開発者が利用Sora(動画生成)
テキストから動画を生成する AI モデルです。
発表: 2024年2月(限定公開)
特徴:
- テキストプロンプトから最大60秒の動画生成
- 高品質で物理的に妥当な動画
- 複数のシーン、カメラワーク、キャラクターの一貫性
懸念:
- ディープフェイクへの悪用リスク
- クリエイティブ産業への影響OpenAI の API ビジネス
OpenAI は、API を通じて開発者にモデルを提供しています。
API の種類
Chat Completions API:
- GPT-4、GPT-4o、GPT-3.5 Turbo
- 対話型アプリケーションの構築
Assistants API:
- ファイルアップロード、Code Interpreter、検索機能
- 複雑な AI アプリケーションの構築
Images API:
- DALL-E 3 による画像生成・編集
Audio API:
- Whisper による音声認識
- TTS による音声合成
Embeddings API:
- テキストのベクトル化
- セマンティック検索、RAG に利用料金体系(2024年の例)
GPT-4o:
- 入力: $2.50 / 1M トークン
- 出力: $10.00 / 1M トークン
GPT-4 Turbo:
- 入力: $10.00 / 1M トークン
- 出力: $30.00 / 1M トークン
GPT-3.5 Turbo:
- 入力: $0.50 / 1M トークン
- 出力: $1.50 / 1M トークン
DALL-E 3:
- $0.040 / 画像(1024×1024)OpenAI の研究成果
OpenAI は、多くの革新的な研究成果を発表しています。
主要な論文
2017年: Attention Is All You Need(共著)
→ Transformer アーキテクチャの提案
2018年: Improving Language Understanding by Generative Pre-Training
→ GPT-1 の論文
2019年: Language Models are Unsupervised Multitask Learners
→ GPT-2 の論文
2020年: Language Models are Few-Shot Learners
→ GPT-3 の論文、Few-shot learning を実証
2022年: Training language models to follow instructions with human feedback
→ InstructGPT、RLHF の実践
2023年: GPT-4 Technical Report
→ GPT-4 の詳細オープンソースへの貢献
OpenAI は、多くのツールやモデルをオープンソースで公開しています。
公開されたもの:
- Whisper(音声認識モデル)
- CLIP(画像とテキストの統合モデル)
- Gym(強化学習のベンチマーク環境)
- Baselines(強化学習のアルゴリズム実装)
- Triton(GPU プログラミング言語)OpenAI の収益と評価額
OpenAI は急成長を遂げています。
収益の推移
2022年: 約 $28M
2023年: 約 $1.6B(推定)
2024年予測: $5B 以上
収益源:
- ChatGPT Plus($20/月)
- ChatGPT Enterprise(企業向け)
- API 利用料
- Microsoft との提携評価額
2019年: 非営利から営利転換時 → 不明
2021年: $14B
2023年: $29B(Microsoft の投資時)
2024年: $80B〜$100B(最新の資金調達ラウンド)
AI ブームにより、評価額が急騰OpenAI の課題と論争
OpenAI は成功と同時に、いくつかの課題や論争に直面しています。
「オープン」でないという批判
批判:
- 社名は「OpenAI」だが、最新モデルは非公開
- GPT-2 は段階的公開、GPT-3 以降は API のみ
- コードやモデルの重みを公開していない
OpenAI の主張:
- AI の悪用を防ぐため
- 安全性を確保するため
- 競争上の理由AI 安全性への懸念
懸念:
- 急速な商業化が安全性を犠牲にしているのでは?
- AGI が実現した場合のリスクは?
- 一部の研究者は「開発を一時停止すべき」と提言
OpenAI の対応:
- Superalignment チームの設立
- 計算資源の 20% を安全性研究に割り当て
- 外部の安全性監査労働問題
論争:
- AI モデルの訓練データのラベリングを
低賃金労働者に外注している
- 労働条件への批判著作権問題
訴訟:
- New York Times など、複数のメディアが OpenAI を提訴
- 訓練データに著作物を無断使用したと主張
- AI 生成コンテンツの著作権の帰属は?OpenAI の未来
OpenAI は、AGI 実現に向けて前進を続けています。
短期的な展望(1〜2年)
プロダクト:
- GPT-5 の開発(噂)
- Sora の一般公開
- マルチモーダル能力のさらなる向上
ビジネス:
- エンタープライズ市場の拡大
- API の機能強化
- パートナーシップの拡大長期的な展望(5〜10年)
技術:
- AGI の実現?
- より安全で制御可能な AI
- エネルギー効率の向上
社会:
- AI の民主化
- 教育・医療・科学への貢献
- 経済的影響への対応まとめ
OpenAI は、ChatGPT の成功により AI を一般に広く普及させた企業です。GPT-4、DALL-E、Whisper など、革新的なプロダクトを次々と発表し、AI 業界をリードし続けています。
重要なポイント
- ミッション: すべての人類に利益をもたらす AGI の実現
- 主要プロダクト: ChatGPT、GPT-4o、DALL-E 3、Whisper
- ビジネスモデル: API、ChatGPT Plus、エンタープライズ
- パートナーシップ: Microsoft との深い提携関係
- 課題: 安全性、著作権、オープン性への批判
OpenAI のインパクト
- AI を一般に広く普及させた(ChatGPT)
- 大規模言語モデルの可能性を実証(GPT シリーズ)
- マルチモーダル AI の発展を加速(GPT-4o、DALL-E)
- AI ブームの中心的存在
OpenAI は、AI の未来を形作る最も重要な企業の一つです。AGI の実現という野心的な目標に向かって前進しながら、同時に AI の安全性と倫理的な使用にも取り組んでいます。今後も、革新的な技術とプロダクトで、世界を変え続けるでしょう。