もやぶろ

moyashidaisukeのブログだからもやぶろ。フリーランスのエンジニアのダイスケです。プログラム関連とかギター関連とか旅行関連とか色々。

nokogiriとMechanizeでスクレイピングその2

前回の続き
nokogiriとMechanizeでスクレイピングその1 - moyashidaisuke's diary


文字コードをちゃんと設定してないせいか、\nがたくさん出てる。=>gsubで無理やり置換しました。

now_updated = div.inner_text.gsub('\n', '')


class指定で取得するときに、div.class の形式だと部分一致で取れる。
div[@class="class"] だと完全一致になる。
http://www.engineyard.co.jp/blog/2012/getting-started-with-nokogiri/


スクレイピングのスクリプト自体はほぼこれで完成。
残りは、サーバーにのっけて定期的に実行し、どこか(メールとかTwitterとか)に連携する。