일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- ubuntu
- dataframe
- mysql
- ngui
- sqlite
- boost
- postgresql
- SVN
- pandas
- expect
- python
- pi
- sql
- List
- conda
- Shader
- Eclipse
- 쉘
- c++11
- 배열
- C++
- SSH
- FIND
- if
- with
- DROP
- null
- autovacuum
- awk
- Unity
Archives
- Today
- Total
목록python (25)
その先にあるもの…
[PYTHON] BeautifulSoup get_text()
현재 문서에서 모든 태그를 제거하고 텍스트만 들어 있는 문자열을 반환. 하이퍼링크,문단, 기타 태크가 여럿 들어 있는 텍스트 블록에 사용하면 태그 없는 텍스트만 남는다. from urllib.request import urlopenfrom urllib.error import HTTPErrorfrom bs4 import BeautifulSoup def getTitle(url): try: html = urlopen(url) except HTTPError as e: return None try: bsObj = BeautifulSoup(html.read(), "html.parser") title = bsObj.body.h1 except AttributeError as e: return None return ti..
프로그래밍/Python
2017. 6. 26. 09:43