データを見つけることは、データを利用するための第一歩です。データが見つからないのにどうやって使えるのでしょうか?データ マップ、データ カタログ、さらにはデータ アセット プラットフォームなど。実際のところ、目標はただ 1 つ、データ プラットフォームによって処理されたデータを表示し、データを必要とする人々がデータの使用の最初のステップであるデータの検索を完了できるようにすることです。 ここでのデータ マップは、メタデータについて説明したデータ管理の記事で紹介したメタデータと基本的に同じです。ただし、表示形式はより柔軟にすることができます。つまり、1 つは R&D 用、もう 1 つはビジネス アプリケーション用です。 メタデータ セクションでは、通常、インターフェイスは、それが属するデータ ソースに応じてツリー構造で表示されます。 データ マップには通常、検索ボックスのあるホームページがあります。検索リストの詳細ページにはさまざまなタブがあります。 表紙 ホームページの主な機能は検索機能です。ユーザーが検索したいコンテンツを入力し、あいまい一致検索を行った後、あいまい一致コンテンツのリストが表示されます。ここのリストはテーブルの内容です。 拡張バージョンの場合、この検索を使用して、データ サービス API、レポート、大画面、さらにはデータ資産の記事を検索およびクエリできます。これについては、資産検索でさらに詳しく説明します。 詳細ページ 検索後、特定のフィールドをクリックすると検索の詳細が表示されます。 詳細ページは、実際にはテーブルの各ディメンションの説明であり、使用するにつれてディメンションの詳細度が増していきます。通常、追加できるディメンションには、基本情報、フィールド、データ プレビュー、パーティション情報、データ監査、データ リネージ、更新情報、処理タスク、評価などが含まれます。 基本情報 基本情報には、テーブルの英語名、中国語名、テーブルの説明、作成時間、担当者などの基本情報が含まれます。 そして、このメタデータはどのデータ ウェアハウス レイヤーとビジネス領域に属しているのでしょうか?この情報は、データ管理の第 2 章のテーブル レベルの計画で設定されます。 フィールド テーブル内のフィールド、フィールド タイプ、フィールドの説明をリスト形式で表示します。フィールドの説明情報が豊富で包括的であるかどうかも、データが包括的であるかどうかの重要な側面です。 データプレビュー データをクエリする必要はありません。データプレビュー機能を提供すると、テーブル内のデータがどのように見えるかがわかるため、データ利用者はより直感的なユーザーエクスペリエンスを得ることができます。 ここでの問題は、データを直接クエリする場合、データをクエリするときに使用するリソースを選択する必要があることです。事前にデータを保存する場合は、どれくらい保存するか、どのストレージを使用するか、更新するかどうかなどの計画が必要です。 パーティション情報 HIVE などのビッグデータ ストレージの場合、パーティション テーブルの場合は、パーティション情報、パーティション フィールド、最新のパーティションを一覧表示する必要があります。各パーティションはいつ更新され、データが書き込まれますか? データ監査 この情報は、実際にはデータ探索プロセスに近いもので、ユーザーが要約用の SQL を手動で記述する必要なく、一部のフィールドの特性を事前に要約することと同等です。フィールドの最大値、最小値、または平均値の場合。列挙フィールドの場合は、列挙値がいくつあり、それぞれの値がいくつカウントされているか。数値型の場合、数値型フィールドの分布はどうなっているかなど。 この情報は、範囲の問題を含むテーブル内の計算の結果です。計算をいつ実行するかを指定します。計算を実行するために使用されるリソース。これらを熟考した後にのみ、この機能をより適切に実装することができます。 データ系統 データ リネージは、タスク ガバナンスの章にあるエンドツーエンドのタスク リネージ リンクの簡略化されたバージョンとして理解できます。ここでは、テーブル間の上流と下流の関係のみが表示されます。影響分析、データトレーサビリティなどのユーザー。表示は依然として写真形式です。 更新情報 各テーブルを更新したり、フィールドを追加したり、フィールドの種類を変更したり、フィールドを削除したりする必要があります。テーブルの変更情報全体をここに記録できます。 処理タスク 対応する処理タスクがインターフェイスに表示され、どのタスクがこのテーブルを生成したかが直感的にわかります。 評価する 評価関数はより柔軟です。これは、データの人気度やデータの信頼性などの公式な評価である可能性があり、この信頼性は、OLAP のデータ指標の使用で言及できます。統一された指標であれば一貫性が保証され、それを示す公式ラベルが追加されます。 また、ユーザー指向で、追加するフィールドやデータの正確さなど、このテーブルに関する意見を提供することもできます。これにより、情報収集とフィードバックのためのチャネルが確立されます。 生成されたデータサービス テーブルを元に生成されたデータサービスAPIの場合は、対応するAPIが直接表示されます。 SQL に基づいている場合は、このテーブルがどのデータ サービス API ロジックに配置されているかも反映されます。 |
>>: ユーザー維持分析: ユーザーの定着率を向上させ、ユーザーのライフサイクル価値を高める
起業家が経済的なプレッシャーに直面すると、ライブストリーミングが新たな戦場になります。この記事では、...
初期監査:再監査:主任監査人:追加監査人: A. マスターデータ会社所在地 基本データ会社名 設立年...
Shopeeへの参加を申し込むパートナーは多数いますが、Shopeeの参加審査は非常に厳格です。時々...
企業のビジネスが 1 つの製品だけに依存するのは非常に危険です。 Tiktokの開発が妨げられた後、...
同じアカウントでも、異なる人が運用すると運用効果が全く異なります。この記事では、プロフェッショナル ...
2023年には、一連の大きな業界の変化と新たな消費現象がすべて、消費業界における新たな変化を意味しま...
はじめに: この記事のタイトルは簡潔かつ明確です。ユーザー価値と取引認知について詳しく解説した記事で...
Shopeeプラットフォームで店舗を開設している商店はまだたくさんあります。しかし、店舗を開設する際...
わずか1ヶ月でフォロワー数が驚異の158万人を突破!この数字は驚くべきものであるだけでなく、Xiao...
新たなコーヒーのコンセプトとして、テンプルコーヒーは若い消費者グループにとって重要なガイドとなってい...
今年のダブルイレブンでは、美容・パーソナルケア部門が再び素晴らしい成果を達成しました。現在、ますます...
コンテンツ化は、ほぼすべての大手インターネット企業が行う必要があることです。現在、Alipay もコ...
世界的な電子商取引大手である Amazon は、毎日何万もの新製品を発売しています。販売者にとって、...
今では誰もが越境電子商取引を利用して商品を購入しており、友人の中にも越境電子商取引を行っている人がい...
ブランドが海外に進出する場合、多くの未知の要素に遭遇することがよくあります。十分な準備をせずに国内の...