BIGLOBEは、企業向けに提供しているブログ分析サービス「感゜Report(かんどれぽーと)」において、抽出ノイズを半減させる新機能「話題文脈判定機能」を搭載いたしました。
- 従来のブログ分析サービスの課題
通常、ブログは、複数の話題が混在して書かれるケースが大半であるため、ブログ分析では、調査対象の話題以外のノイズをいかに低減させるかという課題があります。例えば、食事したレストラン、帰宅途中に買ったビール、テレビドラマの話題などが混在するブログから、ビールの話題のみを調査したい場合、従来方式では、ビール以外のレストランやテレビドラマの話題がノイズとして含まれ、正しく分析できないことが多々ありました。
- 抽出ノイズを半減させる新機能 「話題文脈判定機能」
新機能「話題文脈判定機能」では、
1. 調査対象の関連ワード抽出
2. 文章ごとの関連スコア計算
により、ブログから、抽出ノイズをなるべく含まず、調査対象に関する箇所のみを抽出することが可能になりました。
- 調査対象の関連ワード抽出
NECが独自に開発した特許取得アルゴリズム「拡張型確率的コンプレキシティ」(注1)により、過去のブログ記事群から調査対象の話題に関連するワードを自動的に学習してきます。
- 文章ごとの関連スコア計算
1.で求めた関連ワードから、ブログの文章ごとに調査対象の話題かどうかを示す関連スコアを計算することにより、調査対象の話題と見なされる文章を抽出します。
これにより、当社の従来方式(注2)と比較して、抽出ノイズ混入率を2分の1以下に低減させることが可能になりました。また、調査対象の話題の出現以下全文を抽出する一般的な方式と比べると、抽出ノイズ混入率が4分の1になりました。
その結果、利用者はブログの分析に当り、ブログ文章のチェックにかける工数が半減することになります。
今後も、ブログ分析のさらなる精度改善を図ると共に、ニーズに応える新しい機能を搭載してまいります。
(注1)
膨大なテキストデータから、注目する文章に偏って出現する特徴的なワードを抽出する方式
(特許番号:特開2001−266060)
(注2)
調査対象話題の出現以下一定範囲を抽出する方式。調査対象話題の出現以下全文抽出よりも抽出ノイズを少なくできる。
BIGLOBEは、一人ひとりの “かなえたい想い” を実現するサービスパートナーとして、最新技術の活用や多様なコラボレーションにより、魅力的なサービスを提供してまいります。 |