1、三个问题编者指南:作为AI产品经理,你需要洞察你所负责的业务,然后根据具体的业务需求和用户需求做好产品架构设计。那么,你知道AI的图像识别业务吗?本文结合实践经验,总结了AI图像识别的相关业务原理。
1.AI业务的盈利模式是否完善合理?
我个人认为这是PM最可能遇到的问题。她专注于现有业务,失去了观察相邻业务形式的整体视角。对市场多样性缺乏了解限制了拓展业务的思路和视野。
之前,我负责的产品的主要服务对象是g端客户,以帮助他们识别图像中的功能并提高业务效率。后来,当我去洗手间时,我突然有一个很大的脑洞。我想除了g端,我还可以为b端服务。因为很多中小微企业不具备实现这些系统的技术能力,我可以为这些企业提供SaaS服务,一是增加公司利润,二是通过市场测试产品。
2.投入产出比能否达到公司预期?
明确他们负责的产品属于长期收入还是短期收入。伟大的形式没有形状。如果是一条长线,那么就规划迭代产品,规划每个阶段的输入和输出,大象是看不见的,大声音是稀疏的,控制每个细节,天赋自然地展现出来。
3.产品是否符合公司的政策和发展基调
PM直接负责公司和需求。两者的重点与排名相同。有时好的产品不符合公司的利益。如果你是外行,你会做出决定。
过去,我们公司的利润点在g端,但b端在中国也有大量客户。公司规划的发展方向是逐步放弃g端,专注于b端。因此,我将在b端努力工作,并尽最大努力与b端建立更多的业务联系,无论它是否属于我负责的业务。
2、产品架构设计当公司资源、业务需求等各种条件复杂时,可以通过划分配置层、操作层、应用层等维度进行产品设计。
1.配置层
它用于帮助客户配置AI产品的规则和逻辑。可能包括:
- AI识别模型库,它用于维护标识模型的类型。也是业务中科技含量最高的模块,便于日后查询和管理;
- AI权威模块,管理相关业务人员对AI服务的客户进行操作和定义;
- 手工审计管理模块,用于管理是使用AI识别还是手动识别的规则;
- 事件定义模块,用于定义事件的判断结果和触发条件;
- AI服务周期,AI用于管理有效服务期。
2.操作层
第二,检查AI的识别结果。AI标签库可以用来验证AI的识别结果,提高识别的准确性。您还可以使用手动注释的数据来优化现有算法。
3.应用层
AI的结果直接面向客户。可以设计通知触发规则,它用于管理通知的内容、触发频率和受众类型;客户类型,根据客户类型向客户展示识别结果和数据可视化内容。
三、图像识别道德原则1.概念
通过当前现有的数据对算法对模型进行训练,以总结数据规则并预测新数据的结果。
2.学习风格
分成《预测学习》和《描述学习》。
1)预测学习
在模型训练之前,提取特征并手动标记。目标是,给定由一系列输入和输出实例组成的数据集,学习从输入x映射到输出y。
这里的数据集称为训练集,实例数称为训练样本数。对于给定的x,可以将观测值与预测值进行比较。
例如,我们现在有大量狮子和老虎的照片。首先,在每张照片上贴上相应的动物标签。然后将这些贴有标签的图片输入模型,让模型知道狮子和老虎的长相。最后,我们找到一些新的、未标记的图片,供模型识别图片中的内容。这是一个完整的监督模型机器学习过程
2)描述性学习
直接将数据扔到算法模型,也称为“群集”。
给定一系列仅由输入实例组成的数据集,目标是在数据中找到有趣的模式。
描述性学习有时被称为发现。这种问题没有明确定义,因为我们不知道要寻找什么模式,也没有明显的错误度量。为了让机器理解对象之间的关系,我们最终将真实特征转换为“向量”进行计算。
比如擎天柱,张三和,如果细分,张三和,我应该是一种,因为我属于人类;擎天柱属于机械行业。最后,这三个人属于生命的范畴。
3)算法模型
目前,各种算法模型都有各自的优点。没有一种算法能被证明比其他算法更好。每个算法都是为了解决特定场景的问题。通过比较,只能找到特定场景中更好的算法。
目前比较流行的算法主要是基于对象、区域、上下文等场景的分类算法:
①基于对象的场景分类
该分类方法以物体为识别单元,根据场景中的特定物体区分不同的场景;大多数基于视觉的场景分类方法都是基于对象的,即通过识别一些有代表性的对象来确定自然的位置。
典型的基于对象的场景分类方法包括以下中间步骤:特征提取、重组和对象识别。
缺点:随着加工的深入,潜在的错误会被放大。例如,上层小物体的识别通常受到下层相机传感器的原始噪声或照明变化条件的影响。特别是在一个宽敞的环境中,目标往往非常分散,这种方法的应用也很有限。
需要指出的是,这种方法需要在特定的环境中选择一些固定的对象。通常,深度网络用于提取目标特征并对其进行分类。例如,PCA算法实现了人脸识别的降维原理,消除了冗余和噪声的干扰。测试步骤如下:
②基于区域的场景分类
首先,通过目标候选区域选择算法生成一系列候选目标区域,然后利用深度神经网络提取候选目标区域的特征并根据这些特征进行分类。
例如K-均值该算法将n个对象按其属性划分为k个类别,使结果满足以下要求:同一类别中的对象相似度高,不同对象的相似度小。损失函数的定义如下:
其中xn是要分类的数据点,μK是第K类的中心,而RNK∈{0,1}表示数据点xn到K的属性(其中n=1,n;K=1,K)
如果数据点xn属于k类,RNM=1,否则为0。
通过迭代求解,K-means得到使损失函数J{μK}最小的所有数据点的属性值{RNK}和聚类中心
③基于上下文的场景分类
与前两种算法不同,这种方法将场景图像视为全局对象,而不是图像中的对象或细节,可以减少局部噪声对场景分类的影响。以输入图像为特征,提取能够概括图像统计或语义的低维特征。
这种方法的目的是提高场景分类的鲁棒性。由于在自然图像中很容易混合一些随机噪声,这种噪声会对局部处理产生灾难性的影响,但对于全局图像,这种影响可以通过平均来减少。
基于上下文的方法通过识别全局对象而不是场景中的小对象集或精确的区域边界来解决分割、目标识别和分类方法中遇到的问题,因此不需要处理小孤立区域的噪声和低层图像的变化。
4、图像识别过程图像识别技术综上所述,主要包括四个步骤:
1)一是获取信息,主要是将传感器的各种信息转化为电信号,即获取被识别对象的基本信息,并通过“聚类”将其转化为计算机识别的信息。
2)然后是信息预处理,主要是对图像进行去噪、变换和平滑处理。在此基础上,对图像的重要特征进行了改进。
3)二是特征提取与选择,主要是指模式识别中图像特征的提取与选择。一般来说,识别图像具有多种特征。如果采用某种分离方式,则需要识别图像的特征。获取特征也称为特征提取。
4)最后是分类器的设计和分类决策,其中分类器的设计就是根据训练结果制定识别规则。基于该识别规则,可以获得主要类型的特征,从而不断提高图像识别的识别率。然后,通过特征识别,实现对图像的最终评价和确认。
5、工作申请作为PM的锅,PM对技术领导者的战略应该是明确和完整的。例如,为了识别照片中的人是否戴着帽子,我们需要描述帽子的颜色、类型、位置和其他尺寸信息。
最佳使用爬行动物爬上许多帽子,然后判断帽子是否戴在人的头上。在语音识别中,需要建立一个字符库,改进和优化字符库的内容。
通过收集和分类,我们将对产品的需求有一个直观的了解,但随着研究的继续,我们可能会发现其他问题。为了避免遗漏有价值的信息,我们在这个阶段收集的案例应该有更多的分歧。
6、用户感知改善对于用户来说,他们能感知的是产品的拟人化。但AI的产出是否合理,取决于人们的主观判断。这也是数据注释的意义所在——通过注释尽可能使模型更像真实的人。例如,在情景对话中,虽然有些答案听起来很有趣,但只要输出结果合理,它们仍然会被接受。
- 老巫婆:你认为谁是世界上最美丽的人?
- AI:是白雪公主!
- 老巫婆:再给你一次机会重新组织你的语言!
- AI:是白雪公主!
- 老巫婆:你看得很清楚。我手里拿着一把刀!
- AI:是你。你是世界上最美丽的人!
PS:与AI算法工程师沟通技巧
客观、可量化、数字化和个案分析。详情如下:
企业说:老板,你能优化这个模式吗?许多地方是不允许的,顾客抱怨。
建议的沟通方式:
商界人士说:医生,这个模型的准确率能提高到95%吗?因为目前,图像上的三个点都属于特征点,但都没有被成功识别。
本文最初由@赵走叉发表。每个人都是产品经理。未经允许不得转载。
题图来自unsplash,基于cc0协议
最新评论