しまノート

日々のメモや勉強内容をまとめていきます,自分のために.

【Python】取得したWebページのHTML要素をExcel形式で保存する

【目的】

取得したWebページのHTML要素をExcel形式で保存

 

【タスク】

  1. URLからhtmlのページを取得します(requests.get)
  2. htmlのページから要素を抽出します(BeautifulSoup)
  3. tkinterを使用して、保存するExcelファイルのパスを選択するダイアログボックスを表示します(filedialog.asksaveasfilename)
  4. 抽出した要素から各要素の種類(タグ名)の一覧を作成します(sheet_names)
  5. それぞれの要素の種類(タグ名)に対応するシートを作成します(create_sheet)
  6. 各要素を対応するシートに書き込みます
  7. Excelファイルを保存します(workbook.save)
  8. 処理が完了したことを表示します(print("finish"))

 

【コード】

make_list_htmlelemets.ipynb

 

【結果】

要素毎にシートが作成された.

また,シートの中には,該当する要素がリストアップされた.

結果