lml

使用lml代替beautifulsoup

我觉得beautifulsoup不好用,速度也慢(虽然可以使用lxml作为解析器了).另外soup.find_all这种简直就是手工时代的操作(很多人使用find find_all这几个函数, 其实它们使用起来不是很愉快)多使用soup.select才是正确的选择, 多简单方便.爬虫对html页面做的操作,大部分时候在选取东西,find_all还要自己手工去写(比如手工写正