データ分析を行うには、データが必要です。データが真実でなかったらどうなるでしょうか?データが人為的に歪められたらどうなるでしょうか?データが人為的に歪められている場合、それを受け入れるように求められたらどうしますか?今日はこの話題について話し合いましょう。 以下は最も一般的な 9 つの方法ですので、まずはこれらを覚えておいてください。年末総括、年間計画、活動評価などで遭遇することになります。事前に知っておくと、早期に対応しやすくなります。 ランク1: 偽データ取引先が故意にデータを偽造、虚偽報告、または報告を怠った結果、基本データが欠落し、エラーが頻繁に発生します。紙のシートが使用されていた時代には、このような状況は非常に一般的でした。しかし、データ システムの普及に伴い、この問題はますます少なくなっています。 ユーザーの紙の申請書やアンケートなど、紙のシートが使用されるシナリオがまだある場合、この問題は依然として存在します。解決策も非常に簡単です。WeChat カード ウォレットを使用してください。これは何時代ですか?会員登録するには、紙のフォームに記入する必要があります。 ランク2: 手動で数字を変更する参照: システムは死んでいるが、人々は生きている。この問題を解決する唯一の方法は、評価を強化し、規則に違反した者を厳しく処罰することです。これらの操作は非常に規則的であり、特定の人々の行動と密接に関連しているため、分析を通じて特定できます。 ステージ3: 口径の変更データが良くない場合はどうすればいいですか?統計的な口径を直接変更します!本質的には、データ指標は計算の利便性のために設計されており、ユーザーであるビジネス側はそれを自由に変更できます。しかし、口径の変更により、前後のデータに不整合が生じており、大きな問題となっています。 指標の名前を変えずに統計的な能力だけを変えると、本物と偽物を混同してしまうという大きな問題が生じます。したがって、口径を変更し、過去のデータ レポートをすべて新しい口径に合わせて一度に更新するだけで問題ありません。 ステージ4: リズムをコントロールする参照: これは、会社を欺くためにデータを改ざんする重大な行為であるランク2とは異なりますのでご注意ください。レベル 4 は、本質的にデータを改ざんするのではなく、販売、運用、報酬のルールを使用して個人の利益を最大化します。 実際、誰もがこれを行います。それはビジネスの暗黙のルールです。 「水が澄みすぎて魚がいない」とよく言いますが、人に自分のことだけ考えないように求めることはできません。管理が厳しすぎると、最前線の営業マンは必ず仕事を辞めて逃げてしまいます。 データ アナリストとして、これらの特定の問題を識別し、許容範囲内で制御できる必要があります。問題が広範囲に及ぶ場合には、制度レベルでの最適化と調整を促進する方法を検討します(下図参照)。 この質問から中級レベルの難易度に入ることに注意してください。後続の質問では、データ アナリストのより高度な分析能力が要求されるからです。たとえば、どれが合理的な暗黙のルールで、どれが悪意のある変更であるかを区別するには、ある程度の分析経験が必要です。 ランク5: ランダムリズムデータ分析をしていると、次のような質問をよく耳にしたことがあるはずです。
しかし、一生懸命に大量のデータを掘り起こして調べた結果、何も問題はないことがわかりましたか?おめでとうございます。あなたはリズムを台無しにするという罠に陥ってしまいました。ビジネスマンが言う「衰退」「悪い」「不満」という言葉は、誤った主張である可能性が非常に高いです。 ビジネス側が不注意でデータ判断を歪める可能性があり、多くの新しいデータ アナリストがこの罠に陥る可能性があることに注意してください。多くの初心者は分析をするときに、それが真実かどうかを問うのではなく、なぜそうなのかをすぐに研究し始めます。データはユーザーグループ、登録時間、製品タイプなどによって細分化され、最終的には何も意味をなさないものとなりました。 2日後に戻ってみると、問題はもう存在していなかった。 この種の問題に対処するには、次の点に注意してください。 「大きさ、量、高さ、スピード、品質」などの問題に遭遇したときは、まず基準について尋ねてください。 特定の質問を聞いたときは、まず相手がその質問をどのようにして知ったのかを尋ねます。 人々がデータについて話しているのを聞いたら、まず元のデータソースについて尋ねてください。しかし、難しいのは、この 3 つの「まず質問する」ことが人間の本能に反しているという点です。人々は、聞いたことはすべて間違っていると信じる考え方に慣れているため、一見単純なこの 3 つの質問を理解するには、何度も繰り返して集中的にトレーニングする必要があります。そうしないと、混乱してしまうことがよくあります。 レベル6: 満足度ここでの満足度とは、業務部門から口頭で言及されるものの、システムを使用して直接記録することが難しい指標を指します。同様のものとしては、満足度、ブランド影響力、製品力、業界の地位、NPS などがあります。直接的な記録がないため、予期せぬことがたくさん起こります。 レベル7: 自然成長率最後に、データを操作したい場合は、「自然成長率」データを変更し続けるだけです。うまくいかない場合は、負の数に変更できます (以下を参照)。 このアプローチに対処する最善の方法は、彼を無視することです。アクティビティの実際の参加者数は簡単に計算できます。自然な成長率を決定したい場合は、後で不要な面倒を避けるために事前にそれを明記することができます。 ランク8: リファレンスグループ参照グループと自然成長率は苦悩する兄弟です。 「科学的評価」という名のもとに、企業が満足するまで勝手に変更・修正することは容易です。 ビジネス側が反論したい場合、設定した参照グループは非科学的であり、サンプルはすべて例外であり、十分にランダムではなく、代表的ではないと主張し続けるでしょう。 実際、完全な統計でない限り、それは常に「非科学的、非ランダム、非代表的」と分類される可能性があります (本当に完全な統計を行うと、自然増加は排除されていない、などと言われるでしょうが、とにかくそれは常に意味をなします)。 対処する最善の方法は、応答しないことです。グループ化の方法が事前に明確にされていれば、どのような結果が出ても受け入れるべきです。文句を言うことは何もありません。独自の参照グループがあり、限られたチャネルを通じて正確なプッシュを行う場合にのみ使用できます。 参照グループを設定することは、AB テストのテスト方法の 1 つにすぎません。 Abtest 自体は単なるテストツールの 1 つであり、権威あるルールではありません。 ABtest事業部がなければ、判断能力は全くないのでしょうか?あなたのビジネス能力はどうですか?お前は何の役に立つんだ!とても気持ちいいです、ついに私も罵り返すことができます! レベル9: 総合評価問題を評価するときは、単一の指標を使用するのが最も明確です。しかし、人々は「包括的に考えている」ように見せるために複合指標を使用することを好みます。 指標が多数ある場合は、重みの配分を設計する必要があります。それからトリックが始まります。評価結果に満足していない場合は、「この重みは不合理であり、実際のビジネス状況を反映できません」と言って、変更を強制します。 最終的な結果は当然人々を満足させ、あなたの分析は詳細かつ合理的であると言われるでしょう。そうでなければ、心配し続けてください。最もとんでもないことは、あるビジネスリーダーが支店会社のスコアランキングを手書きで書いて、私にこう言うのです。「あなた方はビッグデータ人工知能方式を使って、さまざまな指標を組み合わせて総合的にこのランキングを計算し、完璧にこなしました。来年はあなたと契約を結びます...」 もちろん、この時点で私が言えることは、「OK」です。契約書に署名することは重要であり、科学性は重要ではありません。重みが変わっただけで、大学院時代には何も起こらなかったかのようです。 対処方法: 各指標を個別にスコア付けし、リーダーが複数の指標の重みを決定できるようにします。ビジネス上の説明性が低いニューラルネットワーク方式は廃止します。ビジネス側で意見が異なる場合は、戦いの後にリーダーにデータをどのように決定するかを伝えます。 上記の 3 つは、高レベルでデータを操作する方法です。レベルが高い理由は、自然増加率、参照グループ、総合評価自体がデータ分析でよく議論されるテーマだからです。業界に新しく、苦労を経験したことのないデータアナリストの多くは、仕事が複雑であればあるほど高度なものだと考え、こうしたことをいじくり回すのが大好きです。 結局、仕事が複雑になるほど、ビジネス上の意味を説明するのが難しくなり、ビジネス側から疑問を抱かれることが増えます。結局、あなたは鼻先で誘導されて、「結果がビジネスに有益であれば、それは客観的かつ包括的である。結果がビジネスに有益でなければ、詳細な分析が欠けている」ということになります。あなたはトラブルを招いているのです。要約 部門によって使用する方法が異なっていることがわかります。 営業、プロモーション、サプライチェーンなどの最前線の部門にとって、データ自体は仕事の直接的な成果物であるため、データソースを改ざんすることが最も簡単です。運用、企画、製品などの部門は、定量化が難しい指標を作成したり、「広範囲にわたる影響」について話したり、「自然成長率」や「参照グループユーザー」を多数設定してそれらを削除したり、データに基づく判断を改ざんしたりしたがります。 なぜ販売、プロモーション、サプライチェーンは混乱しないのでしょうか?なぜなら、彼らが直面しているのは、販売からお金を集めること、プロモーションのために人材を募集すること、そして倉庫から商品を出荷することといった、確固たる課題だからです。各人が受け取る金額は非常に明確であり、言い争う余地はありません。しかし、全員が協力して運用、計画、製品などに取り組んでいる場合、常に自分の貢献を強調したいと考えています。 こうして終わりのないおしゃべりが始まった。 「自然な成長を除いて、私の活動はどれくらいの利益をもたらすのでしょうか?」 「自然な成長と活動主導の成長を除いて、製品の改訂によってどれだけの利益がもたらされるでしょうか?」 「自然な成長、活動主導の成長、製品の改訂を除いて、私のコピーライティングはどれくらいの利益をもたらすのでしょうか?」 ... 2 つの危険を比較すると、データ ソースの改ざんの方が明らかに有害です。 データが偽であれば、分析を行う意味はありません。データソースの改ざんは、同社の経営が混乱しており、チャネル管理が弱いことを示しています。面白いのは、本社の各機能部門がこうした弱点を嫌うため、この問題に関しては本社各部門が一斉に外部に銃を向けることが多いということだ。しかし、データの判断となると、上から恣意的に判断されてしまうことが多いのです。 本社の業務、製品、企画担当者が自分たちの利己的な利益のために勝手に基準を変えてしまうと、真のデータ駆動型開発を実現することは非常に有害です。事実を直視せず、データを使ってごまかそうとするあまり、結局は事業部門自体が判断力を失い、衝動的に決断して何も考えずに立ち去るという本来の姿に戻ってしまいます。これは私たちが見たくないものです。 理想的な状態は、データソースが現実的かつ豊富であり、データ判断が単純かつ明確であり、データ分析が詳細かつ立体的であることです。より良い結果を出せるように、原因の発見、予測、効果のテストに重点を置きます。 |
<<: 現在のブランド競争は、もはや知性の競争ではなく、物語の競争です。
>>: 東方セレクション:お客様が買うのは農産物ではなく、「知識のライブ放送」
一方には人気の王宝があり、もう一方には消費を誘発する疑いで繰り返し摘発されてきた出会い系プラットフォ...
今年は中秋節と国慶節の連休が重なっており、8日間の長期休暇により国民の旅行の選択肢も増える。観光市場...
Douyinでは、ストーリーを語ることでお金を稼ぐことができます。両者とも民話を共有しているが、お...
現在、ShopeeやWishなど、多くの越境電子商取引プラットフォームがあり、これらは良い選択肢です...
最近また生放送界が賑やかになってきました。東方振軒は海外に行きたいと思っていますが、その前にすでに誰...
現在、オンラインストアを開設する場合、ストアのデータを管理する必要があります。なぜなら、データはスト...
ホットソース市場の熾烈な競争の中で、湖邦ホットソースは独自のシーンベースのブランディング戦略で際立っ...
MCNとネットセレブの間の矛盾は、業界の歴史の中で長い間存在してきました。業界の運営者は、両者の関係...
2025年WeChatオープンクラスは1月9日に非公開で開催され、WeChatチームが計画している...
この記事では、7月から8つの文章を厳選しました。言葉の魅力だけでなく、ブランドと消費者の感情的なつな...
この記事は、淄博のバーベキューレストランの発展の歴史から始まり、淄博の観光熱の盛衰を分析します。この...
このような背景から、国境を越えた決済はますます重要になってきています。越境決済サービスとして、万里匯...
越境ECプラットフォームとして、Amazonは非常に発展してきました。このプラットフォームで欲しい商...
越境電子商取引の販売チャネルがはるかに広いため、多くの人が越境電子商取引を好みますが、初心者の中には...
現在、越境電子商取引に携わる企業は数多くあります。越境電子商取引に携わることを決意したのであれば、適...