chrome elements html로 저장하기
·
python/personal
len()으로 길이 확인 안하고 진행했더니 시즌 3의 후반부 몇 개가 빠진 상태로 저장이 끝났다. 완료 됐다고 생각해서 실행하던 파일도 삭제를 했는데, 다시 해야해서 다시 selenium 사용하는거 보다는 그냥 한 페이지를 html로 저장해서 진행해보기로 했다. F12를 눌러서 보이는 개발자모드에서의 Elements의 html 파일을 저장해야 하는데 처음 저장해보는거라서 조금 헤맸다. mhtml을 이용해서 해봤는데, 중국어가 제대로 출력이 되지 않는 문제점이 발생해서 html 그대로 작업하는 방법을 찾았다. 페이지 소스보기로 보이는 화면이랑은 달라서 그냥 저장으로는 내가 원하는 정보를 추출할 수 없다. html이 시작하는 줄에서 오른쪽 마우스를 누르고 copy outerHTML을 한 다음에 메모장을 켜서..
확장자 없는 파일 뜯어보고, 그 안에 담긴 정보 이용💾
·
python/personal
제목을 뭘로 해야할지 모르겠다.... 마도조사 드씨를 뒤늦게 알게돼서 부랴부랴 마오얼FM 가입하고 결제를 했다. 예전에는 안드로이드 폰을 사용해서 다운을 받고 파일 디렉토리에 있는 임시 파일의 확장자를 .mp3로만 바꾸면 재생이 된다고 해서 다들 그렇게 소장을 하고 있는 것 같았다. 다만 내가 너무 늦게 알았는지 지금은 단순히 확장자명을 바꾸는 걸로는 안돼서, 혹시 이 파일을 가지고 온전한 파일을 만들 수 있지 않을까 싶어서 파일을 뜯어봤다! 파일의 확장자가 아예 없어서 이게 어떤 파일인지 짐작이 안됐다. 디렉토리명이 sound_blob이라서 blob to mp3, blot to audio 등등 다양한 검색으로 검색을 해봤지만, 방법을 찾지 못했다ㅠ 그러다가 파일을 notepad로 열어보니 m4a 정보가..
BeautifulSoup을 이용한 mp4 주소 추출/저장, mp3 변환
·
python/personal
KBS 라디오 극장에서 듣고 싶은 라디오 드라마가 있어서 사이트를 둘러보니 python을 이용해 파일을 저장할 수 있을 것 같았다. 그래서 사이트에서 MP4 주소를 추출하고 저장한 후, MP3로 변환하는 작업을 해보려고 한다. from selenium import webdriver import time import requests from bs4 import BeautifulSoup from urllib.request import urlopen driver = webdriver.Chrome("./chromedriver.exe") webpage = "주소" driver.get(webpage) # 해당 페이지의 html 소스를 가지고 와서 보기로 함 req = driver.page_source soup = ..
_xxxx
'python/personal' 카테고리의 글 목록