彩云天气地理查询优化(2): 行政区划查询

在彩云天气 App 和 API 里可以获取到当前经纬度的气象预警信息,比如「大风蓝色预警」。 不同国家地区的预警发布规则不一样,在中国是按照行政区划层级来发布...

彩云天气地理查询优化(1): 气象站数据查询

我们从一个实际业务场景的谈起: 如何找到离北京市海淀区 768 创意产业园最近的 K 个国家级观测站? 最简单的思路是完整遍历所有候选站点,然后计算每个站点...

彩云天气地理查询优化(0):序

在彩云天气内部有全球范围成千上万个各种类型的观测站以及大量的多边形数据,支撑着彩云天气数据 API。 那么如何在这些海量的观测站中找到用户周边的...

December 2, 2022

投影、坐标与瓦片

一篇漫谈地图投影、坐标和瓦片的文章

通过 UberH3 正六边形划分行政区

通过 UberH3 正六边形聚合的方法将实际生活中的坐标转换成网格 id, 再通过网格 id 定位 adcode(行政区域信息)

《Align, Mask and Select: A Simple Method for Incorporating Commonsense Knowledge into Language Representation Models》论文讲解

本论文通过提出AMS法构造multi-choice QA数据集,基于Bert,训练更好语义理解的预训练模型,拟解决QA中词义消歧问题,并在commonsenseQA,WSC,GLUE的相关下游任务fine-tune取得sota

April 15, 2020

升级 rb 到 Python3.7

如何让 Python2 和 Python3 版本的 crc32 结果保持一致

nujson 诞生记

这个夏天,我们尝试将一个 Python2.7 的项目升级到 Python3.7,期间发现 NumPy 在 Python3 上出现了一些和 JSON 序列化有关的问题

GeniePath:自适应感受路径的图神经网络

GeniePath,蚂蚁金服发表于 KDD 2018,一种可扩展的能够学习自适应感受路径的图神经网络框架。

May 30, 2019

A Semaphore Killer

简而言之,彩云使用了 LAIN(PaaS/Docker) 部署一部分生产和开发应用,在实际使用过程中遇到了信号量泄漏 (Semaphore Leak) 的问题,于是 @siqing_yu 写了一个 Semaphore Killer 脚本清理泄漏的信号量。 ...

January 23, 2019