データ操作 |データ活用の第一歩—データの検索

データ操作 |データ活用の第一歩—データの検索

本記事では、データ活用のプロセスにおける「データの発見」の重要性に特に重点を置いて、データ運用について詳しく解説します。著者は、データ マップ、データ カタログ、データ アセット プラットフォームなどのツールを詳しく紹介しています。これらのツールの目的は、データ プラットフォームによって処理されたデータを表示し、データを必要とするユーザーがデータを簡単に見つけて使用できるようにすることです。

データを見つけることは、データを利用するための第一歩です。データが見つからないのにどうやって使えるのでしょうか?データ マップ、データ カタログ、さらにはデータ アセット プラットフォームなど。実際のところ、目標はただ 1 つ、データ プラットフォームによって処理されたデータを表示し、データを必要とする人々がデータの使用の最初のステップであるデータの検索を完了できるようにすることです。

ここでのデータ マップは、メタデータについて説明したデータ管理の記事で紹介したメタデータと基本的に同じです。ただし、表示形式はより柔軟にすることができます。つまり、1 つは R&D 用、もう 1 つはビジネス アプリケーション用です。

メタデータ セクションでは、通常、インターフェイスは、それが属するデータ ソースに応じてツリー構造で表示されます。

データ マップには通常、検索ボックスのあるホームページがあります。検索リストの詳細ページにはさまざまなタブがあります。

表紙

ホームページの主な機能は検索機能です。ユーザーが検索したいコンテンツを入力し、あいまい一致検索を行った後、あいまい一致コンテンツのリストが表示されます。ここのリストはテーブルの内容です。

拡張バージョンの場合、この検索を使用して、データ サービス API、レポート、大画面、さらにはデータ資産の記事を検索およびクエリできます。これについては、資産検索でさらに詳しく説明します。

詳細ページ

検索後、特定のフィールドをクリックすると検索の詳細が表示されます。

詳細ページは、実際にはテーブルの各ディメンションの説明であり、使用するにつれてディメンションの詳細度が増していきます。通常、追加できるディメンションには、基本情報、フィールド、データ プレビュー、パーティション情報、データ監査、データ リネージ、更新情報、処理タスク、評価などが含まれます。

基本情報

基本情報には、テーブルの英語名、中国語名、テーブルの説明、作成時間、担当者などの基本情報が含まれます。

そして、このメタデータはどのデータ ウェアハウス レイヤーとビジネス領域に属しているのでしょうか?この情報は、データ管理の第 2 章のテーブル レベルの計画で設定されます。

フィールド

テーブル内のフィールド、フィールド タイプ、フィールドの説明をリスト形式で表示します。フィールドの説明情報が豊富で包括的であるかどうかも、データが包括的であるかどうかの重要な側面です。

データプレビュー

データをクエリする必要はありません。データプレビュー機能を提供すると、テーブル内のデータがどのように見えるかがわかるため、データ利用者はより直感的なユーザーエクスペリエンスを得ることができます。

ここでの問題は、データを直接クエリする場合、データをクエリするときに使用するリソースを選択する必要があることです。事前にデータを保存する場合は、どれくらい保存するか、どのストレージを使用するか、更新するかどうかなどの計画が必要です。

パーティション情報

HIVE などのビッグデータ ストレージの場合、パーティション テーブルの場合は、パーティション情報、パーティション フィールド、最新のパーティションを一覧表示する必要があります。各パーティションはいつ更新され、データが書き込まれますか?

データ監査

この情報は、実際にはデータ探索プロセスに近いもので、ユーザーが要約用の SQL を手動で記述する必要なく、一部のフィールドの特性を事前に要約することと同等です。フィールドの最大値、最小値、または平均値の場合。列挙フィールドの場合は、列挙値がいくつあり、それぞれの値がいくつカウントされているか。数値型の場合、数値型フィールドの分布はどうなっているかなど。

この情報は、範囲の問題を含むテーブル内の計算の結果です。計算をいつ実行するかを指定します。計算を実行するために使用されるリソース。これらを熟考した後にのみ、この機能をより適切に実装することができます。

データ系統

データ リネージは、タスク ガバナンスの章にあるエンドツーエンドのタスク リネージ リンクの簡略化されたバージョンとして理解できます。ここでは、テーブル間の上流と下流の関係のみが表示されます。影響分析、データトレーサビリティなどのユーザー。表示は依然として写真形式です。

更新情報

各テーブルを更新したり、フィールドを追加したり、フィールドの種類を変更したり、フィールドを削除したりする必要があります。テーブルの変更情報全体をここに記録できます。

処理タスク

対応する処理タスクがインターフェイスに表示され、どのタスクがこのテーブルを生成したかが直感的にわかります。

評価する

評価関数はより柔軟です。これは、データの人気度やデータの信頼性などの公式な評価である可能性があり、この信頼性は、OLAP のデータ指標の使用で言及できます。統一された指標であれば一貫性が保証され、それを示す公式ラベルが追加されます。

また、ユーザー指向で、追加するフィールドやデータの正確さなど、このテーブルに関する意見を提供することもできます。これにより、情報収集とフィードバックのためのチャネルが確立されます。

生成されたデータサービス

テーブルを元に生成されたデータサービスAPIの場合は、対応するAPIが直接表示されます。 SQL に基づいている場合は、このテーブルがどのデータ サービス API ロジックに配置されているかも反映されます。

<<:  アルゴリズムエンジニアの死

>>:  ユーザー維持分析: ユーザーの定着率を向上させ、ユーザーのライフサイクル価値を高める

推薦する

鍾雪高が「サツマイモ売り」をライブ配信、黄太極が「毛沢東選集」をライブ配信:CEOが借金返済をライブ配信し始めたとき

起業家が経済的なプレッシャーに直面すると、ライブストリーミングが新たな戦場になります。この記事では、...

AVE 監査レポートの例

初期監査:再監査:主任監査人:追加監査人: A. マスターデータ会社所在地 基本データ会社名 設立年...

Shopee登録が拒否された場合、再度登録できますか?登録にはどれくらい時間がかかりますか?

Shopeeへの参加を申し込むパートナーは多数いますが、Shopeeの参加審査は非常に厳格です。時々...

チャン・イーミンの代わりとなるTikTokを見つけるのは難しい

企業のビジネスが 1 つの製品だけに依存するのは非常に危険です。 Tiktokの開発が妨げられた後、...

Xiaohongshuプロフェッショナルアカウントは操作方法が異なり、効果も大きく異なります。

同じアカウントでも、異なる人が運用すると運用効果が全く異なります。この記事では、プロフェッショナル ...

2024年の消費見通し:「慎重な予算編成」の必要性がますます高まる

2023年には、一連の大きな業界の変化と新たな消費現象がすべて、消費業界における新たな変化を意味しま...

ユーザーの価値と取引を認識する

はじめに: この記事のタイトルは簡潔かつ明確です。ユーザー価値と取引認知について詳しく解説した記事で...

Shopee を中国本土の銀行カードにリンクできますか?引き出しの要件は何ですか?

Shopeeプラットフォームで店舗を開設している商店はまだたくさんあります。しかし、店舗を開設する際...

1か月で158万人のフォロワーを獲得した小紅書は、年末までに「大復活」を遂げた。

わずか1ヶ月でフォロワー数が驚異の158万人を突破!この数字は驚くべきものであるだけでなく、Xiao...

寺院コーヒーの人気からブランドは何を学ぶことができるでしょうか?

新たなコーヒーのコンセプトとして、テンプルコーヒーは若い消費者グループにとって重要なガイドとなってい...

2022 年の高級美容市場トレンドのレビュー: 新しいグループと新しいカテゴリの両方をどう捉えるか? (優れた)

今年のダブルイレブンでは、美容・パーソナルケア部門が再び素晴らしい成果を達成しました。現在、ますます...

月収30万元超の中小クリエイターはアリペイで最後のブルーオーシャンを見つけたのか?

コンテンツ化は、ほぼすべての大手インターネット企業が行う必要があることです。現在、Alipay もコ...

Amazon で新製品を宣伝する 3 つの方法は何ですか?新製品プロモーションのリズムはどのようなものですか?

世界的な電子商取引大手である Amazon は、毎日何万もの新製品を発売しています。販売者にとって、...

越境決済プラットフォームのランキングは?どちらが良いでしょうか?

今では誰もが越境電子商取引を利用して商品を購入しており、友人の中にも越境電子商取引を行っている人がい...

海外市場に参入したい場合、文化の違いをどう克服すればよいのでしょうか?

ブランドが海外に進出する場合、多くの未知の要素に遭遇することがよくあります。十分な準備をせずに国内の...