目の前に積まれた膨大な資料を読んで理解する作業を想像してみてください。毎日、ビッグデータの処理に追われるのは大変ですね。文書(PDFや画像を含む)、メール、音声、ニュース記事、インタビュー、ウェブサイト、さらに外部の資料もあります。
あるいは、銀行などの金融機関から重要な財務情報を受け取り、そこから、人名、組織名、為替レートのようなキーとなる情報を集めます。
Knowledge Engineering and Discovery ツール
そこで、PangeaMT のナレジ エンジアリングとディスカバリ ツールが力を発揮します。データの形式を問わず、文字に変換して処理をおこないます。自然言語処理により、データを構造化して重要な情報を使いやすいフォーマットで抽出します。
キーワード リストのテキストから情報を抽出するだけでなく、ソースをそのまま残すため、e-Discovery とは異なります。
