FORCASのリスト抽出画面で、クローリング対象のウェブサイト内の「名詞」が検索可能になりました。クローリングは月に1度実施いたします。
Q. サービスサイトやサブドメイン等、その企業が保有する公式ホームページ以外も検索対象になりますか?
A. FORCASで保有する、公式ホームページ(URL)、サービスサイト(運営サイト)が主な検索対象となります。サブドメインは一部FORCASに格納がある分は検索対象となっています。
Q. サイト内は全て検索対象ですか?
A. 検索対象は、おおよそ企業のトップページから30リンク先までの「名詞」が対象となります。
Q. 検索して抽出されてきたホームページのテキスト原文はみれますか?
A. あいにく検索結果はFORCAS画面上では確認することはできません。(求人情報サイト検索機能、有価証券報告書検索機能と同様です。)
Q. 完全一致、部分一致 や 後方一致 にも対応していますか?
A. ホームページ検索の検索方法は、単語の「完全一致」のみになります。今回名詞のみが検索対象となりますので、部分一致や後方一致の結果を入れた場合にノイズが発生する可能性があるためです。
※例えば、特色検索は部分検索が可能ですが、ホームページ検索では完全一致のみが対象となります。
Q. 欲しい単語が抽出できませんでした
A. 名詞のリクエストやフィードバックは、こちらのフォームにお願いします:
https://docs.google.com/forms/d/e/1FAIpQLSfdGMwslNMFFuOlKKAdC-koDe4_HqQtqZRF2IjG9bedFfN5sQ/viewform
コメント
0件のコメント
記事コメントは受け付けていません。