重回北京2019
喜欢一个城市是因为熟悉,因为有回忆的地方,讨厌一个城市是因为不愿想起过去,也是有回忆的地方。北京,是一个喜欢的城市,不仅仅是首都,也是我硕士生涯的起点,改变了我的人生轨迹。当初,考研挑选学校,首次是浙大,后来调研发现分数太高自己没有胆量尝试;接着选了华中科技,自己信心很满,慢慢地
喜欢一个城市是因为熟悉,因为有回忆的地方,讨厌一个城市是因为不愿想起过去,也是有回忆的地方。北京,是一个喜欢的城市,不仅仅是首都,也是我硕士生涯的起点,改变了我的人生轨迹。当初,考研挑选学校,首次是浙大,后来调研发现分数太高自己没有胆量尝试;接着选了华中科技,自己信心很满,慢慢地
2018年12月8日,老家新房子“进火”(农村一个习俗称谓,新建房子搬进去住,需要有仪式以及请亲戚吃饭),作为家里的男丁必须得回去一趟。所以,在12月7日请了天年假回了趟老家。 小插曲–学校的变迁这次回家,蹭了室友的车回去,他刚买了新车,需得去家里挂车牌,路途800多公里,刚好我
在58的房产事业群部门,职责是负责资讯、问答、经纪人以及房源的推荐工作,主要偏文本一类,做数据展现的逻辑处理。后来,离开去了新的领域,着重于数据源清洗挖掘出用户行为背后的价值信息,支持推荐等功能。因为,两个不同方向、不同数据源、不同场景平台,感触颇多,对于推荐这块的更深理解和实现
最近下雨变多,下午也没去江边跑步了。 2016年10月秋季招聘,因实验室在无锡,确实没啥(可以说是没有一家)公司来中心招人,毕竟不是学校。我们这届(前几届也一样)需要去上海、南京、北京等地找工作,很是心累。当时我去过南京、合肥、北京、上海,每周去几个点然后回无锡住处。此处省略心酸
互联网金融的数据是异常的特别少,但是数据来源特别广,特别杂,维度高,需要对数据进行聚合,而这带来数据缺失,数据相关性太强(这个没get意思??),容易过拟合。 数据的来源不同,覆盖人群也不同,数据拼接存在缺失,变量缺失对线性模型影响效果。数据缺失的填充方法,常用的是均值/众数/中
点击率预测,在广告、推荐领域应用,精细化操作,平衡用户、商品、平台,传统的逻辑回归,到深度学习,一波浪潮下,带来很多新的方法。 关键问题点击率预测,重在解决的是特征问题,在逻辑回归下,经过经验会挑选少而精的特征,房产领域有均价、小区、面积、位置等,金融领域有职业、身份状态、月收入
注意力机制可快速提取稀疏数据的特征;句子表征,怎么表示一个句子,词嵌入(词映射到高维空间)表达词/词语,句子则是词的组合表达(简单的平均)。 n-gram技术,卷积网络归纳局部信息,将词进行平移,不断地进行“卷积”得到一层高维,然后在高维基础继续卷积,得到更高层次的维度信息。 s
今年很少回老家,之前每年在清明节/国庆节/春节会各回一次老家,今年的清明节因为职场的事情选择没有回来。国庆回来了,比往常路程更久了些,没有抢到南昌到南丰的动车,只坐汽车,慢些。到家已经是晚饭时间。 各种信息流推送的也是烈士纪念日相关新闻,之前看过一些,采取了个性化策略给推荐了这一
通过python爬取各大门户网站的数据,比如儿童/腾讯动漫等。当作是实践python,写写程序。主要是找出源码中html的位置,通过bs4解析,找到参数值/属性值。 汽车之家像汽车之家,http://car.qichedaquan.com/carmaster/KR627009。后
进入新的业务领域,使用新的环境、新的工具,有些不太适应,有些心里抵触,在一个环境习惯后,接触到新的完全不同氛围,会有些隔离状态。 在旧的环境中,一切都是熟悉的,随拿随取,流程清晰明了,不用请教任何人,时常自己做一些小工具方便自己;而新的环境,需要去熟悉每一个环境啊,每一个流程,一