データラングリングのステップ
インポート
複数ソースに接続
Discovery
データ品質を分析して改善
クレンジング
エラーを検出してデータを準備する
変換
非構造化データを変換
エンリッチ化
機械学習でデータを強化
エクスポート
複数の宛先に同期
インポート
複数ソースに接続
多様なソースからデータを収集
データ準備の最初のステップは、さまざまなソースからデータを収集し、それらを照合することです。ビジネスデータは通常、ファイル、フィード、データベース、クラウドデータウェアハウスなど、さまざまなソースから入力されます。
Discovery
データ品質を分析して改善
データのプロファイリングとデータ分布の表示
データラングリングの前に、データの構成や、修正が必要な問題を把握しておくことが重要です。この段階では、列のデータタイプを特定し、列のデータ分布を主要指標を用いて分析します。
クレンジング
エラーを検出してデータを準備する
データ品質を改善
準備しようとするデータには、重複した値や無効な値、不足している値があることがあります。これはデータ品質の低下につながります。こうしたデータは、クリーニングツールやデータラングリングツールにより、さまざまな変換を使用してクレンジングプロセスを進め、データ品質を改善する必要があります。
変換
非構造化データを変換
データのモデル化と変換
クレンジングしたデータは、分析やレポート、あるいはウェアハウジングや消費に必要なフォーマットに変換、モデル化できます。データラングリングツールで利用できるさまざまな変換や機能は、このタスクを行う際に役立ちます。
エンリッチ化
AIを利用した変換
機械学習でデータを強化
データのエンリッチ化は、機械学習ベースのテキスト分析を使ってデータに情報を追加したり、外部サービスのデータソースを使ってデータを強化したりするプロセスを指します。これにより基本データの理解を深め、これまではアクセスできなかった、より詳細な洞察を引き出すことができます。
エクスポート
プラットフォームをまたいで公開、共有
プラットフォームをまたいで公開、共有
ラングリングのプロセスを完了すると、データの公開や共有が可能になります。データは、ファイル、クラウドストレージ、クラウドデータベース、BIまたは分析プラットフォームとしてローカルストレージにエクスポートできます。
Zoho DataPrepを使用したデータラングリング
Zoho DataPrepはセルフサービス型のデータラングリングソフトウェアで、ビジネスニーズに合わせた拡張が可能で、コーディング不要のデータラングリングを支援します。Zohoのデータラングリングツールは、自動化されたプロファイリングやインテリジェントな提案、AIベースの変換などにより、データをすばやくクレンジングします。
Zoho DataPrepを最高のデータラングリングツールにする機能
複数のデータソース
ファイル、REST API、クラウドストレージサービス、データベース、FTPサーバーなど、さまざまなデータソースからインポートできます。
データ品質を改善
重複するレコードや無効または不足したデータなど、データ品質に関わる問題を修正し、データ品質を改善します。
変換と強化
コーディング不要の変換機能を使用して、データの変換やモデル化が可能です。
データパイプラインの自動化
エンドツーエンドのデータパイプラインを設定し、データフローをモニタリングし、データ品質が低下した場合は通知を受け取ります。
安全なデータ共有
役割ベースのアクセス管理を使用して、チームと安全にコラボレーションできます。ユーザーが意図したデータにのみアクセスできるようにします。
データをカタログ化
データを分類してカタログ化し、アプリケーションとの同期が可能なデータセットをマークできます。
"Zoho Dataprep has taken the time it takes to clean and import our data from multiple hours down to minutes.I am able to provide my clients better tracking of their key statistics because I now have an automated way to take in their third-party data."
Bob Sullivan JD
COO, Vector Solutions