Langsung ke konten utama

Parsing Data Dengan Python


Hallo Guys 😂
Kali ini aku akan membagikan tutorial parsing data atau / scraping dengan python
di android

Sebelum itu bantu author Dengan Click iklan dan biarkan beberapa detik ya gan ya , semoga author tambah semangat untuk memperbarui artikel di blog ini setiap hari

Kita Akan Mencoba parsing Dari Blog Page Saya ini Contoh Page


siap kan dulu peralatanya

  • Termux :
sehabis itu install dulu python dan juga module nya caranya

pkg install python pip install requests  pip install bs4

ok pribadi saja kita sanksi aktivitas nya pertama buka dulu quick edit atau nano editor
Tampilan Untuk Quick Edit 

Tampilan Untuk Nano Editor (tools bawaan termux)

Selanjutnya import dulu module requests dan bs4

import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print(soup.prettify())
note : alamat url dapat agan ganti yang lainya

sehabis agan membuatnya menyerupai di atas silahkan coba jalankan dan karenanya akan menyerupai di bawah ini

<a href="https://petitermux.blogspot.com/" rel="nofollow">          </a>         </span>         <span>          berguru bs4         </span>        </div>        <div class="blog-posts hfeed">         <!--Can't find substitution for tag [defaultAdStart]-->         <div class="date-outer">          <div class="date-posts">           <div class="post-outer">            <article class="post hentry">             <h1 class="post-title entry-title">              berguru bs4             </h1>             <div class="post-info">              <span class="item-control blog-admin pid-2102565653">               <a href="https://www.blogger.com/page-edit.g?blogID=2743239978184035798&amp;pageID=5128740299106525223&amp;from=pencil" title="Parsing Data Dengan Python">                <img alt=" Kali ini aku akan membagikan tutorial parsing data atau  Parsing Data Dengan Python" class="icon-action" height="18" src="https://img2.blogblog.com/img/icon18_edit_allbkg.gif" width="18"/>               </a>              </span>             </div>             <div class="post-header">              <div class="post-header-line-1">              </div>             </div>             <div class="post-body entry-content" id="post-body-5128740299106525223">              ini yakni halaman pembelajaran scraping data dengan bs4              <br/>              <br/>              kunjungi terus blog ini, alasannya disini banyak tutorial tutorial menarik untuk termux              <br/>              <br/>              kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux              <div class="clear">              </div>             </div>
ini hanyalah potonganya saja

ok selanjutnya
kita akan mencoba mencari beberapa bab dari blog di atas seperti
• title
• deskripsi blog
• link dll
untuk lebih jelasnya silahkan lihat aktivitas di bawah ini
import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print("1", soup.title)      print("2", soup.title.name)     print("3", soup.title.parent.name)     print("4", soup.p)     print("5", soup.p['class'])     print("6", soup.a)   
silahkan save dan jalankan maka karenanya akan menyerupai di bawah ini

1 <title>belajar bs4 - Jejaka Tutorial</title>                      2 title 3 head                                          4 <p class="description"><span>Blog ini ihwal tutorial seputar termux, dunia hacking, pemrograman, dll </span></p> 5 ['description'] 6 <a href="https://petitermux.blogspot.com/">Home</a>

dengan module bs4 ini kita dapat mencari link link yang tersimpan di dalam blog
caranya :
import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     for link in soup.find_all('a'):         print (link.get('href'))
dikala agan menjalankan nya maka outputnya akan mengeluar kan banyak link yang terkandung dalam blog ini menyerupai di bawah ini
https://petitermux.blogspot.com/ https://petitermux.blogspot.com/p/about.html https://petitermux.blogspot.com/p/name-email-address-important-content.html https://petitermux.blogspot.com/p/div-idbptocloading-toc.html https://m.youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ              https://petitermux.blogspot.com/ https://petitermux.blogspot.com/p/termux.html https://petitermux.blogspot.com/p/mining.html https://petitermux.blogspot.com/p/nuyul.html            https://petitermux.blogspot.com/p/hack.html?m=1 https://petitermux.blogspot.com/ https://www.blogger.com/page-edit.g?blogID=2743239978184035798&pageID=5128740299106525223&from=pencil                                                 https://www.blogger.com/comment-iframe.g?blogID=2743239978184035798&pageID=5128740299106525223 https://petitermux.blogspot.com/feeds/posts/default http://facebook.com/Jejaka-Tutorial-2230728320541897 http://plus.google.com/106273771548209106947 https://youtube.com/channel/UCn5d8Xbp0yt-SWTmxwtayvQ                   http://instagram.com/lutfi_ainun_32

selanjutnya kita akan mencari blog post atau postingan aku dari url di blog ini

Sebelum itu Agan Harus Tau Id dari bab yang akan agan ambil
untuk mengetahui nya caranya
pertama silahkan masukk ke browser anda
pastekan di url browser view-source:https://petitermux.blogspot.com/p/belajar-bs4.html?m=1
kemudian cari id yang akan agan ambil, sebagai pola agan dapat lihat gambar di bawah ini

ok selanjutnya silahkan simak penggalan aktivitas di bawah ini

import requests from bs4 import BeautifulSoup  url = 'https://petitermux.blogspot.com/p/belajar-bs4.html?m=1' with requests.Session() as c:     respon = c.get(url)     soup = BeautifulSoup(respon.content, "html.parser")     print(soup.find(id='post-body-5128740299106525223').text)

silahkan save dan jalankan
outputnya kurang lebih menyerupai di bawah ini
ini yakni halaman pembelajaran scraping data dengan bs4                                                                    kunjungi terus blog ini, alasannya disini banyak tutorial tutorial menarik untuk termux  kunjungi juga channel youtube di sana daerah aku mengupload video video tutorial untuk termux

Hasil nya sama dengan postingan aku yang ada di blog saya

sumber : 


sekian dari aku terima kasih

Komentar

Postingan populer dari blog ini

Cara Menambah Tombol Ctrl Di Termux!!

pasti anda akan kesulitan dalam mengedit file dan kegiatan dalam aplikasi termux versi terbaru bukan , Karena pada Aplikasi Termux Versi terbaru ada beberapa tombol yang tidak dimunculkan  Seperti C TRL, ALT,ESC,TAb, UP, Down, END, Home,   Sehingga kita akan kesulitan dalam mengedit file tersebut oleh lantaran itu maka aku akan memberikan  Toturial Lengkap . Kenapa Tombol CTRL,ALT,Left,Right di sembuyikan? karena para pihak developers aplikasi termux ingin menciptakan aplikasi termux sesimple simple nya makanya ada beberapa fitur dalam aplikasi termux yang di sembunyikan atau harus install Package name dulu. Ok pribadi saja simak tutorial nya:) Toturial Lengkap Cara   Menampilkan Semua Tombol CTRL,Home,Left,Right,ESC pada Aplikasi termux Ada dua cara untuk menampilkan tombol tambahan, 1 method script dan 2 method tombol pribadi saja simak. 1.Menampilkan semua Tombol dengan memakai Script Buka Temux Install pkg dukungan Note; m...

Cara Mining Doge, Ltc, Btc, Dengan Termux | Tools Wolf-M7m-Cpuminer-V2

Hallo Guys 😂😂😊😊 kali ini ane mau share tantang cara mining crypto currency dengan termux, ini bukan tools untuk nuyul atau yang lain tapi tools kali ini murni untuk mining jadi di waktu proses mining ini berlangsung masuk akal saja jikalau suhu HH agan naik drastis Ok kita pribadi saja ke proses instalasi yang pertama agan di wajib kan sudah menginstall ubuntu Sebenar nya ada bebarapa faktor yang mempengaruhi keberhasilan dalam menginstall tools miner ini  Koneksi kurang stabil  Waktu proses instalasi agan membuka aplikasi lain  HH agan Belum Support Di install wolf-m7m-cpuminer-v2 Sebelum Menginstall Tools wolf-m7m-cpuminer-v2 Ini Tolong pastikan koneksi stabil dan juga jangan hingga membuka aplikasi lain selain termux Ok 😊😊 Lanjut Ke Proses Instalasi nya  Pertama kita harus Menginstall ubuntu dulu Copy Perintah di bawah ini untuk menginstall ubuntu di termux apt update && apt upgrade apt install git git clone https://gi...

Cara Cek Proxy Aktif Dengan Termux

Hello Guys Balik Lagi nih ama ane. Kali ini ane mau share wacana tools untuk cek proxy. Tools ini sangat mempunyai kegunaan bagi kalian yang ingin mengecek proxy yang aktif dalam jumlah banyak, Tidak mungkin agan akan mengecek nya satu persatu hehehehe Maka aku buat tool untuk mengecek proxy. Ok kita pribadi saja silahkan simak tutorial di bawah ini. Silahkan Buat File untuk menapung proxy dengan format ".txt" 103.246.2.246:8080 103.250.157.43:38641 103.255.240.66:46324 103.39.246.210:3128 103.44.139.22:8080 103.255.74.169:8080 103.65.193.195:52115 103.4.144.81:36358 103.69.227.246:80 103.75.101.97:8080 103.76.15.28:8080 103.78.254.50:8080 103.76.196.41:8080 103.69.219.53:8080 103.78.254.53:8080 103.83.15.14:9991 103.89.253.247:3128 103.89.253.246:3128 103.89.253.249:3128 103.82.99.177:59376 103.99.196.10:34589 104.41.141.2:81 105.235.66.37:80 107.21.71.98:3128 109.196.179.6:8080 108.179.221.114:3128 103.76.180.209:8888 109.87.24.10:60204 109.188.132.86:8080 109.87.33....