您的位置：首页 > 理论基础

AI-Azure上的认知服务之Computer Vision(计算机视觉)

2019-12-16 14:26 1071 查看

使用 Azure 的计算机视觉服务，开发人员可以访问用于处理图像并返回信息的高级算法。

主要包含如下高级算法：

标记视觉特性Tag visual features

检测对象Detect objects

图像分类Categorize an image

描述图像Describe an image

检测人脸Detect faces

检测图像类型Detect image types

检测特定领域的内容Detect domain-specific content

检测颜色方案Detect the color scheme

生成缩略图Generate a thumbnail

获取感兴趣区域Get the area of interest

从图像中提取文本Extract text from images

管理图像中的内容Moderate content in images

要使用Computer Vision，图像质量必须满足如下要求：

图像必须以 JPEG、PNG、GIF 或 BMP 格式显示
图像的文件大小必须不到 4 兆字节 (MB)
图像的尺寸必须大于 50 x 50 像素
对于 OCR，图像的尺寸必须介于 50 x 50 和 4200 x 4200 像素之间

若要分析图像，可以上传图像，也可以指定图像URL。

图像处理算法可以通过多种不同的方式分析内容，具体取决于你感兴趣的视觉功能。例如，计算机视觉可以确定图像是否包含成人内容或不雅内容，或者查找图像中的所有人脸。

可以在应用程序中使用计算机视觉，方法是：使用本机SDK，或者直接调用 REST API。 SDK中，支持最全的是C# ，部分功能包含Java，NodeJS，Python，Go SDK。

本节实战视频，如何使用Computer Vision:

https://v.qq.com/x/page/m3035yaq8lf.html

下面分别举几个例子介绍计算机视觉API的功能：

图像标记-Tags

计算机视觉在上千个可识别对象、生物、风景和操作的基础上返回标记。当标记内容不明确或者不属常识时，API 响应会提供“提示”来澄清标记在已知场景中的含义。标记不按分类来组织，且不存在继承层次结构。内容标记集合在一起，形成图像“说明”的基础。该“说明”以人类可读语言显示，采用完整句子的格式。请注意，图像说明目前只能使用英语。

上传图像或指定图像 URL 后，计算机视觉算法在对象、生物和图像中标识的操作的基础上输出标记。标记不限于主体（例如前景中的人），还包括场景（户内或户外）、家具、工具、植物、动物、配件、小器具等。