到一个地方签到,随手拍点照片,录段视频,再把这些内容分享给你的朋友,这些都是稀松平常的事。但是如果我告诉你,这些照片和视频能被用来绘制城市的街道和建筑物的地图,你是不是会惊到?如今,VarCity项目用瑞士苏黎世城市的三维建模案明:这已经成为现实。
VarCity是一个计算机视觉研究项目,创立于五年前。该项目采用多源图像的方式,来创建城市三维地图。图像来源包括网络摄像头、交通摄像头、空中拍摄、无人机等。
单是利用这些图像数据,VarCity项目组就创建了苏黎世大范围的三维地图,效果十分精细。在此项目中,这些公共来源的照片将不再是地图的补充,而是作为地图本身的数据源。
VarCity项目旨在以自动的方式解析图像数据,从而构建城市三维模型,了解城市日常动态,而并不是通过照片去挖掘人们的隐私。该项目将数百万张图像和视频一起制成苏黎世的三维模型。这项科技有很多潜在的应用,例如它能分析行人在哪儿、停车场什么时间有停车位。
VarCity项目由欧洲研究委员会(European Research Council,ERC)投资,该团队来自苏黎世联邦理工学院计算机视觉实验室。这个项目的想法最初是由Luc VanGool教授在2011-2012年间提出,并完成撰写。VarCity项目的领导者和研究者Hayko Riemenschneider说:“这个项目把计算机视觉、机器学习的新功能组合在一起,并提升到一个新的高度,这也得益于城市一直都会产生大量图像的事实。正是在这样的背景下,一群年轻的研究人员创建了VarCity项目组。”
在过去的5年中,该团队已经开发出通过图像自动创建城市模型的算法和工具。事实上,这些算法也能区分人行道和马、面和草地等。同理,也能为其它的城市自动创建同样高精度的三维模型。
该项目生成的三维模型可以看作是谷歌街景视图的动态3D版本,同时还附带得出了一些额外信息,诸如城区有多少绿地、建筑物的建筑特色等等。值得一提的是,VarCity地图设计做了隐私内容的考虑,它并不直接展示地图上的所有细节,只是作为创建地图的基础。
这个项目使用通用参考框架,如瑞士坐标系统CH1903+,该系统将同一地点的所有不同结果融合在一起。为了做到这点,团队将他们有的GPS元数据的局部测量转到同一通用坐标系统。
该项目的研究是基于多种数据源的,但在每种应用的情况下都只用到了图像和视频数据。 Riemenschneider博士说:“我们使用2008年采集的航空图像来建立整个城市的粗略模型;然后再使用2013年采集的街景图像,以绘制行车道;最后,使用公共网络摄像头、空中无人机或社交的图像,填充行人区和旅游区。数据越多,城市模型就越精确。”
然而,项目中用到的所有数据都是公开的或有使用授权的,在网上收集的数据都是基于知识共享许可协议而分享的,因此都是允许使用的。
有关机器学习的技术不断提升,包括深度学习、运动结构、3D表面重建、针对物体探测的、追踪、分割(尤其是行人和车辆检测以及影像的语义分割),这些技术均被用于这个项目开发中。然而,这个项目怎样才能帮助到普通人?
随着高科技方法的应用,VarCity能立即评估一个城市的组成,如建筑物、植物、水系等等,同时还能评估单体建筑,如窗户的高度、表面积、太阳透射。另外,它也能提供一个全球交通模型和特殊区域的微观模拟。
所以,试想,如果能对所有大楼阴影部分的阳光进行估计,或是有多少阳光找到窗户,也可以通过观察精细模拟知道多少车辆在街上穿梭,类似的应用还有很多。
VarCity在城市规划上扮演着至关重要的角色,如分区法分析、模拟新建楼房是怎样阻碍其他楼房阳光照射等等一系列问题。未来,这些应用要求大量技术人员利用数字化软件手动建立整个城市的三维模型,人工成本将非常昂贵。届时,VarCity就能快速解决上述问题。Riemenschneider博士说:“我们希望使用图像数据建造模型时越自动越好,希望这些工具让城市三维建模过程变得更加便捷”。
VarCity项目背后的商业机会很多初创公司已经从这个项目中脱颖而出,比如Spectando和Casalva提供虚拟建筑勘察和图像分析,Parquery通过城市三维知识实时监测停车空间。
然而,VarCity项目确实也存在一些小问题,在技术、科学、数据问题上还面临很多挑战,但是因为项目拥有长期投资,所以团队还有时间解决这些问题并得到提升。
Riemenschneider博士说:“我们收集了各种各样云端的网站照片,然而我们没有自己特定的提供数据的平台,我们期待人们上传更多带有地理标签和文本标签的照片。将来,其他正在进行的项目可能会开发出这样的平台。”
推荐: