スキップしてメイン コンテンツに移動

【AIの豆知識】Gemini 3.5 Flash vs 3.1 Pro、トークンがあっという間に溶ける理由と賢いモデル選択ガイド

Gemini 3.5 Flash vs 3.1 Pro Token Guide

【AIの豆知識】Gemini 3.5 Flash vs 3.1 Pro、トークンがあっという間に溶ける理由と賢いモデル選択ガイド

こんにちは!最近、Googleの次世代AIラインナップであるGemini 3.5 FlashGemini 3.1 Proを使ってみて、「あれ?なんでこんなにトークン(コスト)がすぐに消えちゃうの?」と慌てた方も多いのではないでしょうか。

少し質問しただけなのにトークン制限に引っかかったり、高額な請求が来たりする泣きたくなる状況…。一体なぜこんなことが起こるのか、そしてお財布を守りながらAIの効率を最大化するモデルやオプションの選択基準を総まとめします!


1. 私のトークンはどこへ?犯人は「Thinkingモード」

Google Gemini 3.xラインナップの最強の武器は、ズバリ「内蔵型の高度な推論(Thinking)機能」です。これは、AIが最終的な答えを出す前に、内部で深く考える段階を経るというものです。

ここに落とし穴があります。AIが内部で頭をフル回転させながら使った独り言(推論トークン)が、すべて「出力(Output)トークン使用量」に含まれて計算されるという点です!

  • Thinking (High) モードの恐ろしさ: ユーザーが1行の質問を投げただけでも、AIは完璧な答えを出すためにバックグラウンドで独自にエージェントループを回し、何万ものトークンを消費してしまいます。見た目は短い回答でも、実際には莫大なトークンが消費されている元凶なのです。
  • 拡大された出力ウィンドウ: Gemini 3.5 Flashは、一度に出力できる上限が65,536トークンへと大幅に増加しました。モデルが長文を書いたり、深く考え始めたりすると、たった1回の会話でトークンが空っぽになってしまいます。

2. Geminiモデル別「Thinkingレベル」によるトークン消費量の比較

すべてのモデルの最大入力は100万トークン、最大出力は65,536トークンで同じですが、Thinkingの設定によって内部トークンの配分が完全に変わります。

モデルと設定 (Thinking Level) 脳の稼働率 (推論の深さ) 平均的な内部推論トークン消費 特徴と体感
Gemini 3.5 Flash (High) 100% (最大稼働) 20,000 ~ 40,000個 知能はPro級に上がるが、トークンが溶ける
Gemini 3.5 Flash (Medium) 50% (基本バランス) 5,000 ~ 15,000個 速度とコスパを両立した黄金バランス
Gemini 3.1 Pro (High) 100% (超高度推論) 30,000 ~ 50,000個 人間でも数日かかる難問を解く時に使用(高コスト)
Gemini 3.1 Pro (Low) 20% (最小稼働) 1,000 ~ 3,000個 深い思考は省き、大型モデルの知識だけを借りる

📌 核心ルール: [内部推論トークン] + [実際の回答トークン] = 総出力トークン使用量。つまり、考えさせればさせるほど、実際に受け取れる回答の文字数制限が削られてしまうのです。


3. 3.5 Flash (Medium) vs 3.1 Pro (Low): どちらを選ぶべきか?

「では、適度に考える2つのオプションのうち、どちらを選べばトークン効率が良いのでしょうか?」

結論から言うと、純粋なコストパフォーマンス(費用対効果)は Gemini 3.5 Flash (Medium) が圧倒的です。そもそもFlashラインナップのAPI単価がProよりもはるかに安いためです。

⚡ こんな方は [Gemini 3.5 Flash (Medium)] を選びましょう!

  • コスパとコスト管理が最優先の時(最も推奨するバランス)
  • 一般的なコード作成、長い文書の要約、素早い対話など、適度な論理力と速度が必要な時
  • 24時間稼働するチャットボットや自動化エージェントを大規模に運営する時

🧠 こんな方は [Gemini 3.1 Pro (Low)] を選びましょう!

  • AIが一人で悩んでトークンを無駄にするのは嫌だが、大型AIが持つ膨大な背景知識(専門的な法律、高度な医学など)が必要な時
  • 数百ページに及ぶ巨大な文書を読み込ませ、内部の推論プロセスなしで必要な情報だけを正確にすぐ抽出し、長く出力(テキスト抽出と加工)したい時

💡 最後のまとめ & トークン節約の豆知識

  1. 難易度を見極める: 高難度の論理や複雑なデバッグでなければ、Thinkingレベルを MediumLow に下げましょう。これだけでもトークン消費を最大70%以上節約できます。
  2. プロンプトに制約をかける: 回答が際限なく長くなるのを防ぐため、プロンプトの最後に "回答は要点だけをまとめて1,000文字程度で書いて" のような制約条件を明記することをお勧めします。

無条件に最高性能(High)ばかりに固執するのではなく、作業の性質に合わせて設定を調整することが、賢いAI活用の第一歩です。お財布とトークンを賢く守りましょう!


#AI #Gemini35Flash #Gemini31Pro #GoogleGemini #LLM #AI豆知識 #トークン節約

コメント

このブログの人気の投稿

面倒くさいORACLEの文字化け状況

ORACLEはそもそもUTF-8をサポートしてほかの言語はサポートはしているって書いてますが親切ではないようです。 現在サーバー側は昔からUS7ASCIIに設定して日本語を入れてしまい、データは7ビットASCIIモードで読み取りながら日本語のコートがOS側とクライアント側で変換しない必要があります。 クライアント側で文字化けの解決にはNLS_LANGの設定が効くクライアントが必要ですが、一部の有料クライアントにはサポートするようです。 接続構造は参考に https://www.oracle.com/technetwork/jp/content/charcterset-250314-ja.pdf の19スライドのように クライアントからNLS_LANGをUS7ASCIIに設定しても その設定した言語にもらったUTF-8のデータをクライアントが変換すると NLS_LANGを設定しても意味がないようです。 ORACLE SQL Developerがこの様です。 ODBCと直接接続は必ずUTF-8に変換してしまうのでUS7ASCIIになっているDBからはクライアントをいくら変換しても文字化けのままです。 必ずOCI接続を通じてクライアント側から読み取らないとUS7ASCIIは勝手に変換されますね。 この全ての条件が満たした無料クライアントはA5mk2の2.9.1バージョンだけですね。 A5MK2 ver.2.9.1 : https://a5m2.mmatsubara.com/download/a5m2_2.9.1_x64.zip 2.9.1 バージョンでサーバーを設定する場合Uicode変換を強制に無視するオプションがあります。 多分このバージョンの時点ではUTF-8をメインにして設計したDBが少なかったから文字化け対応のためできたオプションでしょう。 しかし、A5mk2の新しいバージョンにもまた結果の変換をしないオプションがなくなって文字化けしてしまいます。開発者はもうUTF-8ではないDBはないと思ってるでしょう。まだまだ残ってますよ~。 クライアント側からの変換などに参考になればと思います! まだ直接お仕事になさってますか? もう遅いです!ソフトウェアロボットにお仕事を任せてどの位自分の作業分量が減ってるかをご確認ください! https://talklowy-jp.b...

コピペができないときチェックすべきこと! :: よく迷うUiPathのコツ

UiPath( https://uipath.com )はMicrosoft社のWWFを改良した製品なのでVisual Studioより初心者向けに使いやすくなっている。 しかし、初心者がそのまま使うにはかなりのハドルがある。 理由は基本開発者向けの開発ツールを無理やり便利に作ってみたとしても開発の概念と考え方がないと結構躓くことが多い。 そのなかで私もよく迷ったりしていることの一つを整理しとく。 基本Activityはすぐコピぺができるので多数のUiPath Studioを開いて開発してたりする。 ここでコピペをしても反応ないときがよくある。 この場合はこれをチェックすること! 1.Sequenceがなく一つのActivityしかないところにはペーストできないのが多い。 例えば、ifの処理ボックスにはSequenceが最初はない。 そのボックスに一つのActivityはペーストできるのに2個目からはなぜか反応ない。 それで分からないまま新しいActivityを追加してたりしたが、 あそこにSequenceを入れたら解決ができるのだ! 2.正常にペーストできるはずのところに反応ない。 この場合はPackageが合わなくペーストが効かないケースが多い。 DESIGN>Manage Packagesをクリックしてコピー元のパッケージにインストールされているのにコピー先にインストールされてないパッケージを探す! パッケージを一々見るのが難しい!と思ったら メモ帳からファイルがあるフォルダにあるproject.jsonファイルを開いてみる! あそこにJSONの形式でインストールされたパッケージが見えるので比較しやすくなる! ちなみにコピペをすると変数の宣言が大変だと思うが、 そこでもコツがあるのだ! 変数の宣言はなるべく細かくしてSequence単位で管理できるようにする。 全てに影響がある変数はしょうがないから一番広く宣言するけど。 初心者向けの説明だと、 Variablesというところをクリックして変数を開いたらScopeという範囲が見える! 大体Sequenceボックスの名前を変えてないのでSequenceがすらりと表示されてるはずが、Sequenceボックスの名前を付けてたら見やすくなる。 あ...

UiPath - Excelのシート名が存在した場合の処理

UiPath.Excel Activityは活用方法によってかなり強力ですが、隠れて探せない項目が多すぎて困ったりします。 公式ドキュメントもいまいちだし…。 Excelを自動化するには協力なUiPathの機能の中でSheetの判断処理を残します。 今まではシートがあったら何とかしようとしたら見つける方法が分からなく、ErrorのExceptionで判断したりしましたが、 workbook.GetSheets.Contains("<sheet name>") があったのをいまさら見つけました; 早速試してみましたが、 messageboxにworkbookとか書いてみても出てこない…。 これはExcel Application Scopeを利用しなければなりませんでした! まずExcel Application ScopeにExcelファイルを登録! Excel Application Scope Activityの属性にOutputにwbを入力して変数に入れます。 変数に入れてからMessageBoxに wb.GetSheet.Contains("Sheet1") を入力してみると成功! 「wb.」をおした時点でいっぱい出てきましたね。 ググってみても詳しく出て着なかったのでここにまず記録 giip - Free UiPath and Rpa Integrated Orchestration Service https://giipasp.azurewebsites.net