Mendapatkan daftar top 250 IMDb

Masalah:
Dari IMDb ingin mendapatkan daftar 100 film terbaik.

Solusi
Ada 250 daftar Top sini: http://akas.imdb.com/chart/top. Untuk mengakses data dari IMDb, saya menggunakan paket imdbpy besar. Ada fungsi get_top250_movies (), tetapi mengembalikan sebuah daftar kosong :)

Selama penelitian, saya menemukan artikel ini untuk SO. Dianggap men-download resmi IMDb dibuang di sini. daftar Top 250 ini ratings.list.gz . Namun, file ini tidak mengandung pengenal film IMDb, sehingga sangat baik untuk apa-apa (

Hanya ada satu solusi :. Mari gesekan kecil di sini Python adalah kode yang melakukan pekerjaan untuk saya, saya tidak menggunakan ekspresi reguler BeautifulSoup ol sederhana

 aplikasi untuk jumlah impor top250_url lagi = & amp; quot; http:. //akas.imdb .com / grafis / Top & amp; amp; quot; get_top250 definition (): r = requests.get (top250_url) html = r.text.split (& amp; quot; n & amp; quot;) hasil = [] ke html secara online: line.rstrip secara online = ( & amp; quot; Tidak & amp; quot;) m = re.search (r'data-titleid = & amp; amp; quot; TT (d +) & amp; line) "jika m; amp; quot; & amp; amp; gt : _id = m.group (1) result.append (_id) hasil pengembalian # 

mengembalikan pembawa IMDb 250 film terbaik Kemudian, menggunakan pertanyaan paket imdbpy langsung semua informasi tentang film, karena. film menjadi proyek

Links:

  • IMDB - & amp;. amp; gt; JSON, jika Anda ingin bekerja dengan berkas dump

Filed under: Python label: IMDB, imdbpy, menggores, Top100, Top250

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>