未来五年,消费者使用语音和图像表达需求的比例将超过50%。
百度董事长兼首席执行官李彦宏表示。简单文字搜索的时代已经渐渐远去。如今的搜索引擎可以直接搜索语音和图片,这也催生了它们在电子商务中的应用,比如根据图片搜索产品。
在图像搜索引擎中,我们熟悉的是谷歌。如果你上传一张图片或者输入一个网址,谷歌会跟随地图,给你图片来源、相似图片等搜索结果。这一切都是基于谷歌的复杂图像识别算法,通过对图像的“指纹”进行扫描,包括像素、颜色和亮度,从而提取图像的特征,进而找出相似的结果优艾设计网_电脑技术。
谷歌必须在这一领域走得更远。根据《纽约时报》报告,来自谷歌和斯坦福大学的科学家团队开发了新一代图像识别技术:用文字描述图片。识别的范围不仅仅是图片,还有视频图片。
目前的图片识别技术只识别图像中的单个物体,而这项新技术识别整个图片,对其进行标记,并用自然语言(英语)进行描述。比如“草原上的大象”和“年轻人玩飞盘”之类的词。图片以这种方式“翻译”后,可以更容易、更准确地进行分类,在被搜索时可以提供更准确的结果。
使用“文本搜索”辅助“图像搜索”的好处显而易见:这项技术还可以帮助视障人士,或者应用于公共监控的安全系统。3354监控摄像头不仅能捕捉到“脸”和个人,还能捕捉到整个画面,包括动作和行为,并自动报警。
换句话说,它为机器认知和自学习提供了新的技术基础。研究人员受到人脑神经网络的启发,这种神经网络允许大脑“训练”自己,并在看到新事物时在记忆中发现类似的东西。谷歌要做的是一个能够识别和理解图片内容的大脑。
认知是人类拥有的一项重要能力。我们的大脑可以通过认知来确定一个人的身份和一个物体的类型,即综合大量的信息,这是人类智力的基础。如果计算机能做到这一点,那就不容易了。谷歌X总共使用了1000台电脑和16000个处理器,创建了一个连接多达10亿个的神经网络,并在1000万个缩略图中发现了包含“可爱小猫”的图片。
当然,这项技术的主要障碍在于识别的准确性。一些图像识别专家对此并不乐观。他们认为它只是复制了人类的视觉能力,但在理解图像时却更加模糊。
然而,计算机科学有必要创造一种新的图形搜索技术来识别“真相”。“我认为图片和视频中的像素数据是互联网的暗物质,我们想照亮它。”项目负责人、斯坦福大学人工智能实验室的费说。
精彩评论