少数の予測は異なる:パート1

ブログ

少数の予測は異なる:パート1

動きの速い商品と動きの遅い商品に関する売上予測を扱う場合、達成可能な精度のレベルを大きく左右する、相対的な予測の不確実性と販売率の非比例的なスケーリングを考慮する必要があります。

  • 同じ予測品質の場合、動きの遅い品目の予測では、動きの速い品目の予測よりも、絶対誤差は必然的に低くなりますが、相対誤差は高くなります。単純なスケーリングの罠を避ける: 売りが遅い銘柄の予測がうまくいかない場合は、低速に向かうときに相対誤差がどの程度増加すると予想されるかを評価します。
  • 「遅い」動きと「速い」動きの間には明確な境界はありません。項目を異なる評価方法に分類するのではなく、評価ですべての予測販売率が適切に扱われるようにしてください。
  • 分析中に、動きが非常に遅い項目が多数見つかりますか?その評価に疑問を投げかけ、集約の時間スケールがビジネスの現実と一致していることを確認します。非消耗性のスロームーバーについては、日常的なビジネス上の決定を下すことはありません。

 

海外では、地元の新鮮で腐りやすい食べ物を試してみてください

パンデミックの時代に旅行するのは簡単ではありませんが、他の文化や風景について学び、もちろんおいしい料理を楽しむ機会でもあります。多国籍小売業者が地球上のあらゆる場所であらゆる要望を瞬時に満たそうと努める、つながりが強くグローバル化された今日の世界においても、特定の製品は場所によってはまったく提供されていないことがあります。統計を数えるブログ記事でこのようなアドバイスを期待する人はいないかもしれませんが、以下の議論の直接的な帰結は次のようになります。海外旅行で料理を最大限に楽しむには、非常に傷みやすい新鮮な特産品を探求しましょう。リオデジャネイロの新鮮なフルーツ、ミュンヘンのオーブンで焼いたプレッツェル、釜山の生の魚介類をお試しください。

実際、釜山では伝統的なバイエルンのプレッツェルを見つけるのは難しく、リオデジャネイロでは生のナマコを買うのは不可能だ(私たちの知る限り)。また、南米からの旅行者は北欧のスーパーマーケットで新鮮な果物の選択肢が限られていることに面白がっている。これらの製品の共通点は何ですか?どちらも腐りやすいので、本来の場所以外で販売されるとニッチな市場になってしまうでしょう。実際、キムチの漬物、オクトーバーフェストビール、カシャッサは世界中に輸出されています。しかし、小売業者が「超新鮮」(非常に傷みやすく、1日程度しか保存できない)かつ「売れ残り」(特定の日に売れない可能性が高い)と呼ぶ商品は、どこにも決して提供されていません。

何故ですか?ブラジルのスーパーマーケットは、確かに小さいながらも確実に存在する生ナマコの需要を満たそうとしないのはなぜでしょうか?釜山の店では毎日100匹のナマコが売れ、リオデジャネイロでは1日1匹の需要があるのに、前者の大きな需要は韓国の小売業者によって満たされているのに、後者はブラジルの店では満たされていないのはなぜでしょうか。ヨーロッパのイチゴのように早く売れる生鮮食品と、ブラジルの生ナマコのように売れ行きの遅い生鮮食品との間には、根本的な違いが何があるのでしょうか。

小売業者が需要の極端に低い商品を販売しないのは、実際の需要を正確に予測できず、廃棄と在庫切れ状況のバランスの中で利益を生む最適なポイントを見つけられないためであることが判明しました。一般的に、小売業者のビジネスは、消費者の需要を実際の売上に変えることです。何をどれだけ在庫しておくべきかを知るためには、従来の人間の直感に基づく方法、最新の統計、さらには機械学習を活用した予測など、将来の需要を可能な限り正確に予測する必要があります。数年前まで、サプライチェーンにおける予測は、ある地域での 1 か月間の乳製品の総売上など、粗いスケールでの大量のデータを対象としていました。扱われる典型的な数字は、少なくとも数百から数千に及ぶ規模でした。今日の計算リソースでは、より詳細なレベルでの予測が可能であり、予測は特定の場所における 1 日の個々の項目を参照します。そのレベルでは、私たちが扱う典型的な数字は 100,000 ではなく、5、1、または 0.1 のように小さいこともあります。予測評価のために確立されたツールを「大きな数字の世界」から「小さな数字の世界」に移すことはできるでしょうか?

技術的には、問題は発生しません。大きな数値向けに作成されたコンピュータ プログラムは、小さな数値でも実行できます。しかし、機能的には注意が必要です。少数の体制に移行すると、売れ行きの速い体制では安全に無視できた統計的な特異性が、関係するようになり、さらには支配的になることもあります。売れ行きの悪い商品に目を向けると、予測テクノロジーの限界を感じ始めます。あらゆるテクノロジーと同様に、予測には根本的に克服できない限界があります。予測の精度(予測値の周りの実際の需要の広がり)と予測の正確さ(体系的に大きい値または小さい値への偏りがない)はどちらも、統計法則によって決まる特定の値を一貫して克服することはできません。ここでは、予測精度の下限、つまり可算量の予測で避けられないレベルのノイズに焦点を当てます。この境界は規模に依存することが判明しました。つまり、売れ行きの遅い銘柄で対処しなければならない相対的な不確実性は、売れ行きの速い銘柄の場合よりも大きいのです。これは、私たちの予測評価方法が規模を考慮したものでなければならないこと、そしてリオデジャネイロでは新鮮なナマコが提供されないことを意味します。

サプライチェーンの明確な道筋を描く

サプライ チェーン コンパス ニュースレターでは、毎月、世界的なトレンドと業界の洞察をお届けします。 

規模が重要

小売業者はなぜ予測される需要に合わせて在庫を増やさないのでしょうか?生ナマコの需要が 1 日 100 個ではなく 1 個である場合、100 個ではなく 1 個だけ用意しておけばよいのでしょうか?売れ筋商品で 10% の誤差を達成できるのであれば、売れ筋商品でも同様に 10% の誤差を達成できるはずです。

この推論は、ナイーブなスケーリングの罠を例示しています。私たちは、テクノロジーと自然のさまざまな領域でナイーブなスケーリングに遭遇します。スーパーマーケットは単なる大きな店舗ではないのに、なぜ違うやり方で運営する必要があるのでしょうか?国はただの大きな村ではないのに、なぜ違う種類の行政が必要なのでしょうか?アリは自分の体重の約50倍を運ぶことができるので、人間と同じ大きさだったら私たちよりもずっと強いのではないでしょうか。ゾウはただの大きなインパラではないのに、なぜこんなに見た目が違うのでしょうか?

ジェフリー・ウェスト著『スケール:生物、都市、企業における生命、成長、死の普遍法則』(ペンギン社、2018年)で鮮やかに説明されているように、異なるプロパティのスケールは異なるということを無視すると、単純なスケーリングの罠に陥ってしまいます。システムの 1 つの特性、たとえば重量に係数 100 を適用しても、サイズ (重量は長さの 3 乗に比例するため、これは当然のことですが) や強度 (それほど単純ではありませんが) などの他の特性に必ずしも同じ係数が適用されるわけではありません。インパラとゾウを比較してみましょう。インパラの足を見てください。小さくて優雅で、壊れやすいです。ゾウは、はるかに重くて大きいだけでなく(インパラの約 100 倍の重さ、約 5 倍の長さ)、外見も異なります。ゾウは確かに独自の優雅さを持っていますが、明らかに、ゾウの脚は弱々しくも小さくもなく、むしろ、ゾウの全体的なサイズが大きいことを考慮しても、イマパラの脚よりもはるかに太いのです。何故ですか?強さと体重の尺度は異なります。体重の 100 倍は、インパラと比較した場合、象の強さの 100 倍にはつながりません (全体的な体格が大きいことを考慮しても)。そのため、象は体を支えるために、はるかに太い脚を必要とします。この非比例的なスケーリングは、ゾウよりもはるかに大きな哺乳類に遭遇しないという根本的な生物物理学的理由です。ゾウをかなり大きな係数で拡大すると、結果として生じる動物の脚は体全体よりも太くなります (クジラなどの巨大な哺乳類には脚がなく、理由があって海に住んでいます)。非比例的なスケーリングは、アリが人間と同じ大きさになったとしても心配する必要がないことも意味します。アリは人間よりそれほど強くないからです。非比例スケーリングにより、スーパーマーケットの運営は小規模な店舗の運営とは別になり、国の行政は村の行政とは別々に組織化できるようになります。最後に、非比例スケーリングは、小さな数値の予測は大きな数値の予測よりも相対的に不正確さが高くなることを意味します。

不確実性はどのように拡大するか

予測を扱うとき、私たちは単純なスケーリングの罠に陥りがちです。なぜなら、「大きい」と「小さい」の違いは、ゾウとインパラほど明白ではないからです。結局のところ、これは数字に関することであり、掛け算や割り算で簡単にスケールアップしたりスケールダウンしたりできます。評価パイプラインは、あらゆる規模の数値を取り込み、適切に評価結果を生成します。このような評価設定は、技術的には任意に拡大または縮小されます。つまり、予測値 1.2 と実際値 1 を比較する場合と同じツールを使用して、予測値 1,200,000 と実際値 1,000,000 を比較できます。ただし、機能的には、大規模な予測の 20% の誤差は、後者の 20% の誤差と同じように解釈することはできません。

ゾウ、アリ、国家の場合、非比例的なスケーリングは基礎となる物理的および社会的ネットワークの構造によるものですが、予測の不確実性の非比例的なスケーリングは、集約による正と負のノイズ変動のキャンセルによって暗示されます。つまり、ある程度のノイズを含むプレッツェルの日次レベルの予測があると仮定します。毎日プレッツェルを 5 個販売すると予測したが、3 個しか売れず 2 個を処分しなければならない場合 (数時間以上経過したプレッツェルを食べたり販売したりすることは考えないでください) があり、需要が 8 個である場合もあります (潜在的顧客が不満を抱くことになります)。長期的には平均 5 個になります。つまり、プラスとマイナスの変動は相殺されます。予測と実際の間の平均絶対誤差は典型的な誤差を定量化し、これを平均売上高 5 で割ると相対的なパーセンテージ値が得られます。このパーセンテージ誤差が小さいほど良いです。1年後(365日後)のプレッツェルの需要数は、次のヒストグラムのようになります。

forecasting-few-is-different-part-1-body-01

1 日の売上が 5 に完全に一致したのは約 70 日だけで、売上が多少ずれることも多かったものの、平均売上は 5 に一致しました。

パン屋ではプレッツェルを何個焼くかという決定は毎日行われますが、他の決定は他の時間スケールに関係します。生地の原料の補充は毎日ではなく、毎週行う必要があります。週レベルで予測を評価するために、毎日の予測を週全体に集計し、週の総売上と比較できるプレッツェル 35 個の予測を算出します。週レベルではどのくらいのパーセンテージの誤差が予想されますか?週レベルの相対誤差は日レベルの誤差よりも小さくなければなりません。つまり、異常に低い売上 (4 以下) の日は、異常に高い売上 (6 以上) の日までバランスが取れている必要があります。潜在的顧客の非常に不確実な個々の購入決定が多数加算され、かなり確実な総売上高に達します。各予測期間における実際の売上は、予測値の周りでランダムに変動します。このような変動値を合計すると、マイナスの変動とプラスの変動が相殺される量が多くなります。週次売上のヒストグラムは、絶対値では上記の日次売上のヒストグラムよりも広くなっていますが (x 軸が変更されていることに注意)、相対値では狭くなっています。

forecasting-few-is-different-part-1-body-02

標準偏差で測定される分布の幅は、分布平均の平方根とともに増加し、相対的な幅 (標準偏差を平均で割ったもの) は平均の平方根の逆数とともに減少します。言い換えると、予測値が大きい場合は多くの不確実なプロセスが影響し、正の変動と負の変動が相殺されて実際の値が予測に比較的近くなりますが、予測値が小さい場合はそのような不確実なプロセスが少数しか影響せず、変動が生き残り、予測と実際の相対的な差を支配する可能性が高くなります。

予想される予測誤差のこの非比例的なスケーリングは、まず第一に、異なる時間スケールで予測される特定の製品で発生します。1 時間あたりに販売されるプレッツェルの数は非常に不確実ですが、1 日あたりのプレッツェルの数はより予測可能で、1 週間あたりのプレッツェルの数はより確実です。ただし、非比例スケーリングは、特定の時間スケールでの販売率が異なるさまざまな製品の動作も制御します。1 日あたりのパンの数の予測 (たとえば、約 50 個) はプレッツェルの予測 (約 5 個) よりも正確であり、プレッツェルの予測はウェディング ケーキの予測 (約 0.05 個) よりもはるかに正確です。繰り返しになりますが、この精度のスケーリングは相対的な誤差を指し、絶対的な誤差は販売率とともに増加します。特定の日にパンが 5 個程度売れることはよくありますが、ウェディング ケーキの変動は最大でも 1 個です (通常は 0 個しか売れず、たまに 1 個売れることもあります)。

動物の強さが体重に比例しないのと同様に、予測の予想誤差も予測値に比例しません。その結果、ゾウは大きなインパラのようには見えなくなり、予測値が大きくなるほど相対誤差も小さくなります。

パート2の準備はできていますか?

少数を予測することがなぜ異なるのかについては、このブログのパート 2 で引き続き説明します。