こんにちは。
はてブとかはてブじゃないサービスとかって、記事の紹介をタイトル+記事のメインっぽい画像でやってますよね。
この画像さ~どうやって拾ってるのかがめちゃ気になる。
urlで画像をスクレイピングして、その中からメインっぽいのをどう判別するのか?
HTML5の場合はmain要素の一番上の画像?HTML5より古ければ画像のデカさとか?何で"メインっぽさ"を判別してるんやろ~~気になる~~。
自分とこにサムネ用画像保存してるんかな。→してた。https://cdn-ak-scissors.b.st-hatena.comってドメインに画像置いてた。まぁさすがに直リンはないか。それは頭おかしいか。
簡単にはなかなかできないもんかね…?