Pthon

为Flask编写1个百度编辑器的插件

原文地址:http://52sox.com/write-a-flask-plugin-for-ueditor/近期项目开发中,隔壁那个搞python的哥们竟然笑着对我说,希望我能给他写1个百度编辑器的demo,方便他直接调用。当时真的受宠若惊,这哥们实力不在我之下,只能答应它了。上网搜索下,有1篇文章Flask项目集成富文本编辑器UEditor实现图片上传功能已经有1个现成

[译]什么是元类metaclass?

原文地址:what is metaclass in Python?我的简书地址::nummy类即对象在理解元类之前,需要先掌握Python中的类,Python中类的概念与SmallTalk中类的概念相似。在大多数语言中,类是用来描述如何创建对象的代码段,这在Python中也是成立的:class ObjectCreator(object):... pass...

sklearn做交叉验证

交叉验证是经常用到的验证方法 使用sklearn可以很大程度上简化交叉验证的过程 使用过程见下方: from sklearn import cross_validation gbdt=GradientBoostingRegressor() score = cross_validation.cross_val_score(gbdt, train_set, label_set,

开发拾遗

python unicode字符串转成中文s = 'u6d4bu8bd5u957fu5ea6's = s.replace('u', '\u')print s.decode('unicode-escape')php 二进制直接量$bin = bindec('110011');$bin = 0b110011;php foreach list$arr = [[1, 2],[3,

手把手教你写电商爬虫-第一课 找个软柿子捏捏

话说现在基本上大家都在网上买东西,国家经济数据已经可以在网络购物的数据中略微窥见一二,再加上目前B2B行业的持续火爆,大有把所有交易搬到网上来的趋势,这个系列教程就来讲讲如果爬取这些大量的电商交易的数据。工具要求:教程中主要使用到了 1、神箭手云爬虫框架 这个是爬虫的基础,2、Chrome浏览器和Chrome的插件XpathHelper 这个用来测试Xpath写的是否正确

matplotlib知识点整理

本文作为学习过程中对matplotlib一些常用知识点的整理,方便查找。强烈推荐ipython[br]无论你工作在什么项目上,IPython都是值得推荐的。利用ipython --pylab,可以进入PyLab模式,已经导入了matplotlib库与相关软件包(例如Numpy和Scipy),额可以直接使用相关库的功能。这样IPython配置为使用你所指定的matplotli

[译] 解密 Airbnb 的数据科学部门如何构建知识仓库

顽疾Airbnb的数据团队很重要的一个职责就是传播基于数据的决策方法。我们将数据的获取民主化,使得每一个Airbnb的成员都可以量化他们基于数据的决策影响力并且借此洞察用户偏好,提升数据产品的用户体验。最近,我们开始解决一个令人头疼的问题。随着组织的扩大,如何确保我们如何确保一个洞见有效地通过社交网络,这在我们内部称之为知识扩张。当我们团队仅由几个乐于分享和发现研究技巧的人

中文维基百科文本数据获取与预处理

照例,先讲下环境,Mac OSX 10.11.2 ,Python 3.4.3。下载数据方法1:使用官方dump的xml数据最新打包的中文文档下载地址是:https://dumps.wikimedia.org/zhwiki/latest/zhwiki-latest-pages-articles.xml.bz2 。方法2:也是官方,结构化数据(json)下载地址是:https:

【译】Seaborn教程(二)选择配色方案

原文:http://web.stanford.edu/~mwaskom/software/seaborn/tutorial/color_palettes.html选择配色方案配色是图表设计里最重要的方面之一,因为如果配色方案好,它可以清晰展现数据的模式和规律,否则就会把这些规律和模式隐藏起来。有非常多学习可视化配色的小技巧的资源,我只讨论了series of blog po