Mungkin banyak yang telah mengenal Wget sebagai alat untuk mendownload berbagai file dari command line (CLI). Apalagi pengguna Linux yang secara default terinstall sebagai aplikasi bawaan karena penggunaan yang efisien.

Wget ini adalah salah satu aplikasi paling digemari para plagiat website seperti saya. Meskipun tidak banyak pula yang memilih curl atau aplikasi lain. Namun saya tidak akan membahas panjang lebar tentang Wget, akan tetapi saya lebih berfokus pada tips dan trik menggunakan wget sebagai alat copy/clone website.

Banyak dari kita yang pembelajaran otodidak menggunakan w3schools, turtorialspoint, dll. serta diluar sana sudah banyak yang menyediakan link download untuk mempelajari website tersebut secara offline. Namun pernahkah anda berfikir, apa yang mereka gunakan ketika melakukan copy/download/clone website tersebut? Pasti banyak yang mengatakan menggunakan aplikasi “Httrack Copier”. Maka saya katakan disini, itu memang benar tapi tidak 100% menggunakannya karena beberapa terdapat kekurangan seperti missing domain dan assets seperti link ke css maupun ke js.

Lebih lanjut nanti biasa anda pelajari sendiri sambil melakukan praktik, entah melakukan cloning menggunakan httrack maupun wget ini atau  curl save.

Trik disini saya hanya memberikan 1 contoh saja, untuk lebih powerfull fungsinya bisa anda kembangin sendiri menurut logika/fungsi masing-masing.

wget -mkEpnp --user-agent='Mozilla/5.0 (compatible; Googlebot/2.1; +http://www. google.com/bot.html)' --no-check-certificate "http://example.com" 

Dari command di atas kita  bisa menjabarkan beberapa param/perintah.

-o = melakukan logger/membuat file
-mkEpnp = gabungan dari perintah (–mirror –convert-links –adjust-extension –page-requisites –no-parent) Baca lebih jelas
–wait = delay untuk menunggu respown dari target link
–user-agent = fake/memalsukan useragent
-–no-check-certificate = menghindari pemeriksaan SSL

Untuk CommandLine diatas mungkin belum sempurna seperti yang saya katakan diatas atau masih seperti hasil dari httrack. namun bisa anda gabungkan dengan pemrograman python untuk melakukan rechack dan validasi url ke localhost maupun current path.

Untuk masalah/error bisa komentar di kolom komentar dibawah 😅

Related Posts

Leave a Reply

Your email address will not be published. Required fields are marked *