[PR]

情報収集の自動化、サイト・クローリング・システムの構築を検討

フリーランス
[PR]

こんにちは、あつしです。

普段の仕事やブログ記事執筆に、必要な情報の収集には手間も時間も掛かりますよね。
情報収集のつもりが、いつの間にか色々な情報に惑わされて、本来の主旨がブレてしまったりすることありませんか?情報収集はどちらかと言えば単純作業ですし、ならば自動化することだって出来るはず!

[PR]

実用化されているスクレイピングサイトが増えてきた。

Googleが検索エンジンに扱う為に、各サイトの情報を定期的にチェックしているのは、よく知られるところです。
最近ではCMで有名な求人サイト大手のIndeedや、宿泊施設サイト大手のトリバゴも、自身で集めた情報ではだけではなく、サイトに掲載されている情報を集め、自身のサイト情報として掲載しているのです。

限られるリソース、道具一つで動き方も変わっていく。

そこでリアルタイムに情報収集する能力と、情報の精査・分類が出来るだけでも自動化出来ると、随分と動き方は変わっていくのだと思いますし、それを人を雇ってやってもらう為には、それなりに資金力が必要になってしまいますので、ならば自分で仕組みを作ってしまえ!と思いたったのです。道具さえ作ってしまえば、あとは運用するだけですので、それであれば人員を導入するのも良いかも知れません。

情報は新たな展開を生みだす。

もう一つ考えている利点としては、集めた情報から共通な情報をデータを抽出することです。
例えば飲食店の名前・住所・メニュー・価格の様なデータがあれば、一定の記事を書くことは容易になりますし、多言語で展開することも比較的容易になってきます。

点在する情報を一元管理、情報の発信源と信ぴょう性の担保が鍵

対象にしたいと考えているソースは、GoogleやYahooの検索エンジンの検索結果と、Twitter・facebook・Instagramなど複数のSNSやブログを含む各サイトの情報が主な情報源にしたいと考えています。

あとはAmazonや価格ドットコム、ぐるなびなど、情報の種類別に情報を統合していければ、また新しい価値観のサイトが出来るのではないか?と思います。

 

このブログでも順次作成状況のご報告をしていきますので宜しくお願い致します。

コメント