这位愿意识别物种的「机器小孩」需要我们一起来训练


机构组织山水自然保护中心
作者自然观察团队
发布日期2018-05-04
点击量220
详情

身为一个“生态搬砖民工”,人生的艰难之处不仅仅是要在高寒缺氧的情况下一天走上几十公里,横渡大江,或者凌波微步跨越流石滩布设相机。

因为纵然看到相机里姿势各异、表情搞怪的野生动物照片可以带来部分的喜悦,但这显然无法弥补最后处理海量数据的抓耳挠心。

一台相机随随便便5000+的照片量,光看起来就足以弄个一下午半身不遂、脑子供血不足。

并不是所有的动物都像下图那样老老实实站好了给你拍👇



👇你能找到动物在哪里吗?


👇你能认出这是什么动物吗?

面对着几千张小草触发拍摄的照片,还是要一张张浏览,生怕漏掉入镜的小祖宗们。

找找看这里到底隐藏着什么?

在三江源,山水自然保护中心、北京大学自然保护与社会发展研究中心与当地合作伙伴以及200多名牧民监测员一起,布设了近300台长期工作的红外相机监测网络,在过去四年多的时间里,这些相机每三个月收集一次,希望从时间和空间的尺度,来看这个区域野生动物的种间关系以及种群变化。

工作人员在安放红外相机 。摄影 / 谢勇东


好吧,每三个月,光数据就超过一个T。在以前,这数十万张照片全部需要工作人员或者志愿者耐心的整理,识别其中出现的物种,并进行标记处理。可不要小瞧这项工作,它对每个人的容颜和气质都有着摧枯拉朽、改天换地的功能。



直到有一天,愤怒的数据管理人员对着上万张新鲜拍摄的红外相机照片眼花缭乱之际,忽然一拍脑门一拍大腿:既然电脑和手机都能自动识别机主了,那是不是也能设计一套程序自动识别红外相机拍摄到的物种

目前的深度学习图像识别技术已经接近成熟,但尚未大规模地应用在动物保护这一领域。这一方面需要海量图片数据库的积累,另一方面也需要解决不可预期的技术问题。幸好,我们团队中能人辈出,不乏北京大学和普林斯顿大学的编程高手们。比如:



于是,一场热火朝天的讨论和测试开始了!


我们有什么数据


大数据时代,数据是第一生产力。经过短暂的讨论后,我们迅速整理75万张已经准确录入,打上标签的红外相机野外照片,这其中包括了雪豹、岩羊等25种珍稀物种,以及大量空拍照片。话不多说,下表一目了然:



我们需要解决怎样的问题



有了这么多基础数据(以及后续源源不断,海量等待录入的数据),我们的任务是:物种识别和分类即将红外相机照片按照物种进行自动分类,降低人工筛选的成本。


我们用怎样的技术



方法看起来很复杂:我们使用了机器学习领域很流行的MXNET进行GPU编程。从已经经历过大量预训练的res18深度神经网络结构出发,以初始为0.0001、每10或100个epoch降低一半的学习率进行了50个epoch的训练,得到相应的结果。对于每个种类的图片,我们用其中随机的80%的数据进行训练,用剩下的20%的图片进行测试。

但实际上很简单:就像是教小孩认动物。预训练的结构相当于见过一些动物图片的小孩,有一定的基础。而训练的过程就是把图片给小孩看,并告诉TA里面有什么。同一物种不同角度、不同时间的照片越多,小孩自然学得越好。为了防止他死记硬背、只记住了见过的图片,我们需要独立的测试集来考察他实际真正学会了多少。


“到底是我们学得快,还是机器呢?” 摄影 / Celine Xu


初步结果


很快,检验成果的时候到了!

牛刀小试:雪豹专项识别

雪豹作为三江源地区的旗舰种,自然值得我们率先为其设计识别软件,即将图片分类为有雪豹与没有雪豹两类进行训练。下为训练结果:

类别

训练数量

测试数量

准确率

非雪豹

580784

149043

0.9988

雪豹

11462

 2867

0.9491

由于train accuracy (小孩识别他见过的图片的准确率)在训练的最后总能达到100%,所以我们不将其写在表中,而只给出test accuracy(小孩识别他没见过的图片的准确率)。此外,由于不含雪豹的照片远多于含雪豹的照片,我们将每种类别的照片的训练、测试数量及准确率分类汇报,防止虚高的正确率。

进一步挑战:全物种识别

有了雪豹专项识别器的经验,我们从而可以为每个物种训练一个识别器。我们将28个种类的照片放在一起进行训练,结果同样喜人:

可以看出,训练照片越多,准确度越高。当训练照片数量达到1000张后,识别的准确率基本可以在90%以上:岩羊、雪豹、白唇鹿以及那些不知不觉中入镜的人类,都被我们的识别软件一一鉴别。同样的雪豹数据,在雪豹专属的识别器下和多物种识别器下并没有显著差别。

另外,有趣的是,藏狐只有374张照片,而赤狐有2942张照片,但是识别藏狐的准确率却比赤狐高,莫非是大脸太瞩目了?


藏狐:这,躺着也可以中枪?45°仰望天空,会不会显得脸小一点?

赤狐:你真是想多了


总结与展望


当前,由志愿者开发的红外相机物种识别软件已初具雏形。可以想象在不远的将来,它可以极大地提升红外相机照片的整理效率,每个月30万张新增的红外相机数据可在2个小时内分类完成,为保护工作者们节省出时间去放更多的相机、做更多的研究、实践更多的保护行动。

正如大家所知,这位愿意学习物种识别的机器“小孩”,如果接受更多的照片训练,就可以成长得越快。

因此,我们已经把操作方法整理好,希望和有同样需求的保护组织进行分享,一起来当这位“小孩”的导师。你可以:

1、联系我们:

张兴梅 zhangxingmei@pku.edu.cn

罗玫 fzluomei@163.com

2、拷贝软件和培训:共同学习软件的安装和使用方法;

3、使用这款软件:进行物种识别;

4、反馈信息:将使用的信息和效果及时地反馈并分享;

5、成为“机器小孩”的导师,作为参与方共同发布这款软件;


希望在大家的合力之下,这位“机器小孩”可以迅速成长,一直长到可以帮我们直接排忧解难的程度。

让我们拭目以待。


撰文/山水自然保护中心 赵翔 李雨晗(研修生)

排版/山水自然保护中心 彭聪(实习)