谷歌搞了个大新闻，用一种特别的办法破解了这个难题

洪水这事儿，每年都能夺走五千多个人的命，是全世界致死率最高的气象灾害之一，而且这玩意儿最难预测。谷歌觉得自己这次搞了个大新闻，用一种特别的办法破解了这个难题——直接读新闻。你想想看，虽然人类收集了好多气象数据，但山洪来得快去得也快，又很局部，不像温度或者河流流量那样能长期盯着看。这就造成了很大的缺口，哪怕是现在深度学习这么厉害的模型，也没法准报山洪。为了解决这个问题，谷歌的研究员把他们的大语言模型Gemini拿出来用了。他们翻遍了全球500万篇新闻，从中挑出了260万次不同的洪水记录，把这些报道变成了带地理标签的时序数据，还给它取了个名字叫“Groundsource”。他们的产品经理吉拉·洛伊克说，这是他们头一回用语言模型干这种事儿。这个Groundsource做好了之后，研究人员又训练了一个基于LSTM神经网络的模型。这个模型一边听全球的天气预报，一边就给特定地区算山洪暴发的概率。现在谷歌的平台上已经能给150个国家的城市标出风险等级，还把数据分享给了应急机构。南部非洲的官员安东尼奥·何塞·贝莱扎跟谷歌合作测试过这个模型，他觉得这个系统帮他们响应得更快了。不过这个模型也有它的短板：分辨率不够高，只能看20平方公里的地方；精度也没美国国家气象局的系统好。这主要是因为谷歌的模型没把实时降水的本地雷达数据算进去。但这个项目的意义在于专门给那些没钱搞气象监测或者没完整数据记录的地方用。罗森伯格说，他们希望用这种从文字里搞出定量数据的方法，以后也能去预测热浪和泥石流。还有一个叫Upstream Tech的公司CEO马歇尔·莫滕奥特也很看好谷歌这一手。他以前就是做水电企业河流流量预测的，他觉得谷歌现在做的就是给深度学习模型找数据的一种新办法。莫滕奥特也创立过dynamical.org，专门给搞机器学习的人整理数据集。他说地球物理学的一个大麻烦就是数据稀缺，看起来很多但真要用的时候又不够用。谷歌这种找数据的方法挺有创意的。