加纳的劳动力市场数据终于被格陵达遥感和随机森林技术细致地分解了,这篇由金炎学者牵头的国际劳工局2026年工作论文,给我们带来了极大的惊喜。 这份报告长达44页,首次将这两项技术结合在一起,把加纳2021年区级人口普查的大杂烩数据,转换成了0.005度高分辨率的精细网格数据。这意味着我们可以看清每个角落的就业情况,以前没人这么做过。 研究团队融合了64个辅助变量,包括土地覆盖、夜间灯光、基础设施等方方面面,用这个模型分析了17个就业类别。从年龄、性别、技能到行业和失业状况,甚至还有NEET青年的情况,都包含在内。模型的整体精度很高,大部分就业类别的解释力超过90%。 数据显示,加纳的劳动力市场分布极不均衡。有的地方像素级的就业率只有10%,有的地方却高达98%。城乡差异和南北差异特别明显。阿克拉、库马西这些大城市的就业机会非常集中,沿海和交通干线沿线也不例外。相反,北部地区很荒凉,只有塔马莱等四个核心区有人干活。 薪金高的工作和技术型岗位都挤在城市的中心区,低技术岗位在城乡都能找到活干。农业受天气和植被影响大,制造业虽然占比不高,却在一些城市形成了专业化的聚集点。建成区、夜间灯光、道路密度和植被健康状况是影响就业的最重要因素。不过不同类型的工作受这些因素影响的方式不一样。 比如农业更看植被指数,制造业更依赖基础设施。模型在处理年轻人、女性和老人的工作情况上有一定局限,因为他们的决定更多受家庭和教育这些没法在地图上显示的因素影响。 这个突破打破了过去只用GDP或人口数来做网格化的单一局面。它提供了一个框架,给那些数据少的地方画社会经济地图用。政府制定政策的时候有了更多具体的参考依据。 接下来可以在辅助数据挑选上做文章,多试试别的机器学习技术,还能结合更详细的行政划分数据来提升精度。如果能搞个劳动力专项调查配合更新数据频率,那就更棒了。下面是报告的部分内容摘录。