2026年5月20日約 11 分で読めます

自社サーバーで動かせる AI はある？ ── オープン・クローズドの構造と業務判断

1. 「自社サーバーで動かす」とはどういうことか
2. AI の「公開」には段階がある ── 3 層の連続体
段階 1：重みのみ公開（Open Weights）
段階 2：コード＋重み公開
段階 3：学習データも含む完全公開（Fully Open）
まとめると
3. 「オープンソース AI」の定義はいまも論争中
4. 閉鎖型 AI も一枚岩ではない
5. クラウド API のデータポリシー ── 「貼っていいか」の確認
6. 業務での選び方 ── 判断軸を整理する
7. 関連する記事
出典・参考文献

「自社サーバーで動かせる AI ってないの？」── AI についての相談を受けていると、この質問は必ず出てきます。

ChatGPT のようなクラウド型の AI を使うと、入力した内容は外部のサーバーに送信されます。社内の機密資料や顧客情報を扱う業務では「それは困る」という場面が出てきます。答えは「あります」です。ただし、「オープン」「クローズド」という言葉の中身が、実はなかなか一筋縄ではいきません。

この記事では、AI の「公開」に何段階あるかを整理します。定義をめぐる業界の議論も正直に紹介した上で、業務での判断軸を 1 本で整理します。

図 1公開度の低いクローズドから完全公開まで 4 段階が横軸に並び、自社運用の可否が変わる起点が重みのみ公開の段階にある。透明性は右列（完全公開）に向けて段階的に増加する

1. 「自社サーバーで動かす」とはどういうことか

ChatGPT や Claude を使うとき、処理の本体は手元にありません。パソコンやスマートフォンは窓口に過ぎず、データはインターネット経由で OpenAI や Anthropic のサーバーに届き、そこで答えが生成されます。

「自社サーバーで動かす」とは、AI の本体 ── モデルのファイル（重み） ── を自分たちのコンピューターに置いて、外部に頼らずに動かすことです。

図 2ユーザーの端末は窓口に過ぎず、重みファイルは外部のサーバー側にのみ存在し、データはインターネットを通じて送受信される

「重み」とは何かというと、AI が言葉を理解・生成する能力が詰め込まれた、巨大な数値の集合体です。本の中身のような存在で、代表的なモデルでは数十〜数百 GB（ギガバイト）になります。スマートフォンの内部ストレージ（128GB 程度）と同じか、それ以上の大きさです。このファイルを手元に置けるかどうかが、「自社で動かせるか」の核心です。

図 3AI が言葉を理解する能力を詰め込んだ重みファイルは、本の中身のような存在で代表的なモデルでは数十から数百 GB に及ぶ

2. AI の「公開」には段階がある ── 3 層の連続体

図 4AI の公開範囲は重みという基礎の層からコードとデータが積み重なる地層のように段階的に深い構造をなしている

「オープンソース AI」と聞くと「全部公開されている」と想像しがちですが、実際には「何が公開されているか」によって大きく 3 段階に分かれます。

なお、業界には MOF（Model Openness Framework、モデル開放性フレームワーク） という本記事の 3 段階に近い分類体系もありますが、本記事では実務判断に必要な範囲で整理します（細部は MOF 仕様書 ¹ を直接参照してください）。

段階 1：重みのみ公開（Open Weights）

モデルのファイル（重み）だけが配布されている状態です。自社のサーバーに持ち込んで動かせます。ただし、どのように学習させたか（訓練コード）や、何のデータで学習したか（訓練データ）は非公開です。

図 5段階 1 では重みファイルのみが公開されており、訓練コードと訓練データは非公開のまま手元に届かない

「本の中身は渡すけど、どう書いたかは教えない」というイメージです。

Meta の Llama 4 が代表例で、Meta 自身が公式ブログでこれを “open-weight” と呼んでいます。² Mistral Large 3 や Google の Gemma 4 も同じカテゴリです。³⁴ いずれも商用利用が許可された条件で配布されています（Apache 2.0 ライセンス）。

図 6重みのみ公開は本の中身を手渡す形で自社運用が可能だが、どう学習させたかという訓練の詳細は公開されない

段階 2：コード＋重み公開

重みに加えて、訓練コードやアーキテクチャ（どういう構造で AI を組んだか）も公開されている状態です。「どういう設計で学習させたか」が外部から確認できます。MOF の Class II（クラス 2）では、この段階に主要な訓練データセットも含まれます。段階 1 と 3 の中間にあたります。

図 7段階 2 ではコードとアーキテクチャが加わって公開され、設計の透明性が段階 1 より高い。訓練データは MOF 定義上も主要なものを含む

業務での選択肢としては、現実的には段階 1 か段階 3 かクラウド型の 3 択が多く、段階 2 が単独で登場する場面は少ないです。

段階 3：学習データも含む完全公開（Fully Open）

重み・コード・訓練データのすべてが公開される状態です。第三者が同じ条件で再現できるレベルの透明性を持ちます。現時点では学術研究用途のモデルが主で、一般的な業務での実用例は段階 1 が中心です。

図 8段階 3 では重みとコードと訓練データのすべてが公開され、第三者が同じ条件で再現できるレベルの透明性が実現している

Allen Institute for AI（AI2）の OLMo 2 が代表例で、重み・訓練データ・訓練コード・評価コード・中間チェックポイントまで公開されています。⁵ EleutherAI の Pythia も、重みから訓練データ（The Pile、825GB）まで揃えた完全公開モデルです。⁶

図 9完全公開モデルは重みとコードだけでなく評価コードや中間チェックポイントまで公開しており、外部からの検証が可能な構成になっている

まとめると

公開段階が上がるほど重みからコード・訓練データへと開示範囲が広がり、完全公開では第三者による再現が可能になる。

公開段階	重み	訓練コード	訓練データ	代表例
段階 1：重みのみ	○	×	×	Llama 4、Gemma 4、Mistral Large 3
段階 2：コード＋重み（主要データ含む）	○	○	主要データを含む	Mistral 7B 初期など
段階 3：完全公開	○	○	○	OLMo 2、EleutherAI Pythia
クローズド	×	×	×	GPT 系、Claude 系、Gemini 系

3. 「オープンソース AI」の定義はいまも論争中

図 10オープンソース AI の定義については OSI と Meta と FSF がそれぞれ異なる方向を指しており業界での合意がまだ形成されていないことを示している

ここで正直に触れておきます。「オープンソース AI」という言葉の意味が、業界でいまも揺れているという事実です。

OSI（Open Source Initiative、オープンソースの定義を管理する国際的な非営利組織）は、2024 年 10 月 28 日に AI 向けの定義 OSAID（Open Source AI Definition）v1.0 を正式に発表しました。⁷⁸ その核心は「使用・調査・改変・配布の 4 つの自由を保障すること」です。

図 11OSAID は使用・調査・改変・配布の 4 つの自由を保障するために、データ情報・コード・パラメータという 3 コンポーネントの開示を要件として定めている

訓練データの完全公開が著作権やプライバシーの制約で困難な場合は、詳しい第三者がほぼ同等のシステムを構築できる程度の情報開示が代替要件として認められています。

図 12訓練データの完全公開が著作権やプライバシーの制約で困難な場合、第三者がほぼ同等のシステムを構築できる程度の情報開示が OSI 定義上の代替要件として認められている

この OSI の基準で見ると、Llama 4 は「オープンソース AI」と認定されていません。主な理由は、競合モデルへの利用制限・月間利用者数（MAU、Monthly Active Users）が一定規模を超えた場合の使用制限・EU（European Union、欧州連合）居住者へのマルチモーダル機能の適用除外などです。⁹¹⁰

図 13Llama 4 は競合モデルへの利用制限と EU 居住者へのマルチモーダル機能除外が OSAID の要件を満たさないと OSI に判定されており、FSF も同ライセンスを非自由ライセンスに分類している

OSI はこれを「オープンウォッシング」── 実際には自由に使えないのに「公開している」と名乗る行為 ── と呼んでいます。

図 14オープンウォッシングとは独占的なソフトウェアをオープンソースと誤表示する行為で、OSI の定義では重みのみ公開のモデルはオープンソースとは認められない

OSAID の定義はいまも更新プロセスが続いており、議論が進んでいます（2026 年 5 月時点）。¹¹

図 15OSI と Meta と FSF という 3 者がオープンソース AI の定義について異なる立場をとっており 2026 年 5 月時点でも議論は継続している。FSF は OSI の立場を支持する方向で主張している

この記事で「公開の 3 段階」を使っているのは、「OSI 基準に合格か否か」の二択ではなく、「実際に何が手元に置けるか」 という実務の視点からの整理です。段階 1 のモデルを使う際は、それぞれのライセンス条件を確認した上で利用してください。

4. 閉鎖型 AI も一枚岩ではない

図 16閉鎖型 AI と思われていた主要各社のモデルは一枚岩ではなくオープンウェイト版が並存しており複数の扉が異なる開き具合で並んでいる

2026 年時点では「クラウド型 AI はすべてクローズド」という単純な図式は成り立ちません。

図 17主要 3 社はいずれもクローズドなフロンティアモデルとオープンウェイトの両形態を同時に提供しており、クローズドと公開は二択ではない

OpenAI は GPT 系の重みを非公開にしています。外部の AI サービスに接続して使う仕組み（API）形式での提供にとどめる理由として、重みや機密情報を管理下に置くためと公式ドキュメントに明文化されています。¹² 一方で 2025 年 8 月には gpt-oss-120b と gpt-oss-20b を商用利用が許可された条件（Apache 2.0 ライセンス）で公開しました（同社として GPT-2〈2019 年〉以来となるオープンウェイトリリース）。¹³ 主力フロンティアモデルとは別の位置づけですが、「同一企業がクローズドとオープンの両形態を同時に持ちうる」ことを示しています。

Anthropic は Responsible Scaling Policy（責任ある拡張方針）で、「後から特定の用途向けに追加学習させること（ファインチューニング）によって安全ガードレールが容易に無効化されうる」として重みを非公開にする理由を説明しています。¹⁴

Google も同様に、クローズドの Gemini 系（API 専用）と、ローカル運用も可能な Apache 2.0 公開の Gemma 4 を並存させています。

図 18クラウド API を通じた利用では応答だけが届き重みファイルは企業の手元に届かないためファインチューニング等の独自カスタマイズには制約がある。応答ボックスは閉鎖型サーバーからの出力先を示す

5. クラウド API のデータポリシー ── 「貼っていいか」の確認

「クラウド型を使うと業務データが学習に使われる」という不安は、現時点（2026 年 5 月確認）では API・エンタープライズの利用においてデフォルトで訓練利用しない方針が各社で確認されています。

OpenAI・Anthropic・Google Cloud の主要 3 社はいずれも、API 利用時のデータをデフォルトで訓練に使用しない方針を表明しています。

提供者	API のデータ扱い（デフォルト）
OpenAI	API・Enterprise からのデータは訓練に使用しない¹⁵
Anthropic	API データは明示的な許可なく訓練に使用しない（ZDR（Zero Data Retention：入力データを一切保存しない契約方式）対応）¹⁶
Google Cloud（Gemini）	有料 API のデータは訓練に使用しない¹⁷

API 利用前に利用プランを確認し、各社のプライバシーポリシーで訓練への利用条件を確認することが、守秘性の判断の出発点になります。

図 19API 利用前に利用プランを確認し各社のプライバシーポリシーで訓練への利用条件を確認することが守秘性の判断の出発点になる

ただし、ChatGPT の無料プランや個人向けプランはポリシーが異なる場合があります。プライバシーポリシーは更新されます。利用前に各社の最新ポリシーを確認してください。

6. 業務での選び方 ── 判断軸を整理する

図 20守秘性と最新性能のバランスを天秤で確かめてからクラウド API か自社運用のどちらのルートを選ぶかを判断するイメージを示している

「守秘データが多い業務か、最新性能を優先したい業務か」── この 2 軸が選択の起点になります。

図 21守秘データが絶対条件かどうかを最初の分岐点として、処理規模によってオープンウェイト自社運用とクラウド API のどちらが適切かを判断できる

守秘性・性能・コスト・処理規模という 4 つの優先事項に応じて、自社運用とクラウド API の選択肢が分かれます。

優先事項	選択肢	業務シーン例
データを外に出したくない（絶対条件）	オープンウェイトモデルの自社運用（社内 IT 担当またはシステムベンダーへの相談が起点になります）	社内 DB・顧客情報・未公開の設計書を扱う業務
最新・高性能の AI が必要	クラウド API（API ポリシー確認の上）	議事録の要約・社外向け文書のドラフト作成
中規模以下のコストを抑えたい	クラウド API（月間処理量が少なければ桁違いに安価）	月数千〜数万件の問い合わせ応答（A4 文書 1 枚 ≈ 1,000〜2,000 トークン）
超大規模処理でコストを回収したい	自社運用を試算（1 日数千万〜1 億トークン（AI が処理する文字量の単位）以上が目安。一般的な中小規模の業務では月額数千〜数万円程度のクラウド API のほうが現実的なことが多いです）¹⁸	製造ライン異常検知ログの一括分析・大量顧客 DB の定期処理

まずは ChatGPT や Claude の API ポリシーを確認して使い始めることが現実的な第一歩です。

自社運用を選ぶ場合は、GPU（Graphics Processing Unit、AI 計算に使う高性能なチップ）を含む専用ハードウェア・モデル更新管理・運用保守のコストとリソースが発生します。クラウド API ではこれらが利用料金に含まれています。

図 22自社運用ではクラウド API に含まれていた GPU ハードウェアとモデル更新管理と運用保守のコストが別途発生し 1 日数千万トークン以上の大規模処理でコスト回収の試算ができる

規制が厳しい分野（医療・金融など）では、データレジデンシー（データの保存場所の要件）から自社運用が必要なケースもあります。¹⁹

図 23医療や金融などデータ規制が厳しく処理量も大きい業種ほど自社運用の必要性が高まり逆に規制が少なく処理量が小さい一般業務ではクラウド API が合理的な選択になる

API ポリシー上は訓練利用なしと確認できても、自社の情報セキュリティポリシーで社外送信が禁止されているケースでは、自社運用が選択肢になります。「ポリシーを確認してから使う」という判断は合理的ですが、社内規程との照合も忘れずに確認してください。

機密データがあるかどうか・費用・管理できる人やベンダーがいるかどうかを、業務ごとに考える視点が判断の核心です。

7. 関連する記事

図 24守秘性の要求度と処理規模で分けた業務判断マップ──高守秘かつ大規模な業務でオープンウェイト自社運用の優位性が最も高くなる。オープンウェイト自社運用が最も現実的な選択肢として中央配置されている

ChatGPT・Claude・Gemini の設計思想の違いについては、ChatGPT・Claude・Gemini はなぜ違うのかで整理しています。

AI に入力してよい情報の判断軸については、AI に貼り付ける前に確認することが起点になります。この記事では「そのデータをどこで動かす AI に渡すか」の上流判断を扱っています。

自社の資料を AI に読ませて活用する実践については、AI に教科書を渡してから聞くを参照してください。

「公開の段階を 3 層に分けて考える視点を持つ」── これがこの記事で整理したことの核心です。「オープン vs クローズド」の単純な二択ではなく、何が公開されていて何が手元に置けるかを確認する。その上で、機密データがあるかどうか・費用・管理リソースを並べて判断する。

自分の業務に守秘データが入るかどうか、これが最初の分岐点です。そこから始めてください。

AI のオープン化は今も進んでいます。OpenAI のように「クローズド」の代名詞だった企業が方針を変えた事例もあります。自分がいますぐ何かをしなければならないわけではありませんが、「選択肢がある」と知っておくことが、いざというときの判断の出発点になります。

出典・参考文献

#AI
#オープンソース
#クローズド
#自社運用
#業務判断
#入門