RSS 写给依然坚持在用 RSS 的我们 最近听完了黄海和 Rio 主持的播客《疯投圈》最新一期 - 《过载时代的信息修养》,深有感触。从信息获取的角度可以将人分为两类,主动获取型和被动接受型。主动获取的人占很少一部分,大部分人都是被动接受的。
机器学习 从数据爬取到清洗 - 全国学校数据 由于工作原因,经常需要收集一些学校信息,全国各地的学校从幼儿园到大学都可能需要,最好的办法当然是从教育部的网站去找,结果可靠权威,也不用后续加工处理,但是教育部网站能查到的只有高校的数据,而且只有一些很基础的信息,缺少地址、邮编、网站、邮箱、联系电话等信息。此外,小学、中学也没有找到。所以就只能自己去写爬虫收集了。