デイリーきみお

おりゃ~~

リンク先のメインっぽい画像をどうやってひっぱっているのか

こんにちは。

はてブとかはてブじゃないサービスとかって、記事の紹介をタイトル+記事のメインっぽい画像でやってますよね。

f:id:oh_yeah_kimio:20190424202825p:plain

はてブスクショ

 この画像さ~どうやって拾ってるのかがめちゃ気になる。

urlで画像をスクレイピングして、その中からメインっぽいのをどう判別するのか?

HTML5の場合はmain要素の一番上の画像?HTML5より古ければ画像のデカさとか?何で"メインっぽさ"を判別してるんやろ~~気になる~~。

自分とこにサムネ用画像保存してるんかな。→してた。https://cdn-ak-scissors.b.st-hatena.comってドメインに画像置いてた。まぁさすがに直リンはないか。それは頭おかしいか。

簡単にはなかなかできないもんかね…?