阿里巴巴达摩院人工智能训练师-高级 人工智能训练师(高级)证书获取教程
内容简介
阿里颁发的证书,在“橙点同学”网站考试拿证。 考试一共34题,可以考两次,第一次不过的话没关系,可以看题析之后
网站描述
阿里颁发的证书,在“橙点同学”网站考试拿证。 考试一共34题,可以考两次,第一次不过的话没关系,可以看题析之后再考,题目都一样的,但题目顺序每个人不一样,但是没事,怕自己忘了就记录下来了

本次教程仅限个人学习参考和练习使用,在实际考试中请根据学习到的认真考试。
教程如下:
一、进入网站橙点同学
网址:orange-class.com
二、登录账号,修改个人信息,实名个人信息

三、点击获得认证
选择人工智能训练师(高级)

四、观看课程
用2倍速挂着就可以了,每看完一个视频,记得回来页面刷新一下看是否显示已学完,因为只有全部已学完,才可以参加考试

每个视频看完之后记得返回到这里选择下一个
视频使用2倍数观看就可以
五、全部学习完成后,考试

六、答案和解析
【妙招】使用快捷键ctrl 启动搜索功能,然后将里面的标题输入进去 就会自动定位到问题为止查看答案
1.请从以下语料中找出标签分类不一致的句子

2.小男孩2岁了,第1次和奶奶一起旅行。以上这段话经过文本正则,归整后的结果是()

3.总数据量为10,模型预测有结果的为6条,无结果的为4条,其中6条有结果的数据中预测正确的是5怎么样,模型准确率是多少,精准率是多少

4.模型的召回率如何计算

试题解析:
模型召回率=预测为正类的数据里正确的数据个数/原本的正类,即RECALL=TP/(TP+FN)
5.书箱分类的标签算是哪种分类任务

试题解析:
书箱分类一般可以根据出版社,语言类型,内容类型等多维度进行分类,所以它是一个多标签分类
6.以下说法错误的是

试题解析:
方言不同于重口音,方言是另一门语言,重口音是地方的人尝试说普通话。在正常对话过程中,大部分人的说话场景属于重口音,重口音识别不好可以在普通话模型基础上加强声学训练。
方言模型的建设要从底层的词典建设开始,需要上万小时的语音和标注数据进行训练和迭代,周期一年起。
7.什么情况下CER字错误率会超过100%

试题解析:
一般删除错误和替换错误不可能超过标注文本总量,但是插入错误是不确定的,所以当插入错误较多的时候CER有可能会超过100%
8.TTS流程中的哪个模块容易造成读音错误

试题解析:
TTS常见的错误
1、读音错误,主要两块text normalization(文本归整模块),Pronunciation tagger(获取读音模块)
2、停顿错误,主要两块word breaker(分词模块),Break tagger(停顿模块)
9.针对“南京市长江大桥”这句话分词正确的是

试题解析:
这里正确分法是:南京市/长江大桥,南京市是一个城市,所以南京和市不应该分成两个词,长江大桥因为长江是河的名字,大桥中大是形容词,桥是名词,所以后面的长江大桥如果分成长江/大/桥是有可能的,所以从这所有答案上看B更为正确
10.表示实际语音中有,识别结果里面有,但是字错误了; 这种是属于识别错误中的哪种错误

试题解析:
sub:替换错误,表示实际语音中有,识别结果里面有,但是字错误了;
11.通过SSML标记()文本内容,可以控制()语音生成的许多方面

试题解析:
通过使用SSML标记格式化文本内容,可以控制合成语音生成的许多方面
12.如果不考虑业务场景的情况下,以下哪个签标与原始文本内容从相关性,定义范围,确定性等方面综合考虑,最合适的是哪一组

试题解析:
以下不正确的原因:A选项:账户登录不上了?—>账户被盗(登录不上的原因不止被盗,标签范围过大),B选项:怎么还不回复我?—>催促(标签没有注明催促对象,标签范围过大),C选项:怎么恢复我的聊天记录内容—>数据恢复(恢复钉钉这个标签范围需要依据产品来判断,而文本内容中未注意是何种产品,所以在产品未知的情况下这个标签范围也是过大了)
13.以下哪类是属于多标签分类

试题解析:
多分类任务一般有以下几种情况:垃圾邮件判别——是/否(二分类),情绪识别——愤怒/高兴/平静(多分类),新闻主题标签——体育,C罗,欧冠(多标签分类)
14.如何提升数据的质量以下说法正确的是

试题解析:
质量更高的数据标准为:没有噪音的数据,训练数据样本平衡,负向样本充足各类丰富
15.以下说法正确的是

试题解析:
训练样本中的数据需要有一个正确的标签,否则会影响到模型效果,质量更高的数据可以训练出更好的模型,同一模型中训练数据的样本需要有一定的平衡
16.构建数据标签的时候以下说法正确的是

试题解析:
构建数据标签的时候我们需要考试正例的同时也需要考虑负例,所以我们需要考虑一些行业属性,某些标签在同的行业中他的标签是不一样的,构建的数据标签范围并不是越小越好也并非越大越好
17.TTS中通常把数字变成汉字是发生在哪个模块

试题解析:
text normalization模块会将文本中的数字,符号,一些干扰合成的一些无意义的,不发音的东西先做归整
18.以下针对数据优化的说法正确的是

试题解析:
并不是增加的数据量越多,数据类型越多就越好,我们应该增加越多的质量比较好的数据,这样模型才会有更好的提升
19.以下哪些场景适用分类模型解决

试题解析:
发送电话号、订单编号、宝贝链接等都存在一定的规律性且更适合通过一些规则及调用接口的方式去解决,所以这里开票流程的相关咨询可以通过分类模型解决
20.请计算以下样本的字准确率是多少?
标注:我最喜欢的运动是排球
识别:吾最喜爱的运动是拍球哦

试题解析:
从识别文本看存在三个替换错误,一个插入错误,CER=4/10=40%,字准确率=100%-40%=60%
21.声音转文字如果没有达到100%,说明这个模型不行

试题解析:
ASR系统是基于算法和概率的,声音转文字就不可能达到100%正确。
22.SSML是语音合成标记语言,它是W3C的语音接口框架的一部分

试题解析:
SSML是语音合成标记语言,它是W3C的语音接口框架的一部分
23.数据标记时只能对原始数据添加一个标签

试题解析:
给原始数据添加一个或多个标签
24.删除错误是指实际语音中有,识别结果里没有

试题解析:
del:删除错误,表示实际语音中有,识别结果里面没有;
25.ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样

试题解析:
ASR的模型识别的是所有说普通话的语音,他不对人做区别,而TTS是千人千面的,每一个人的声音都不一样
26.召回率(Recall Rate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;

试题解析:
召回率(Recall Rate,也叫查全率)是检索出的相关文档数和文档库中所有的相关文档数的比率,衡量的是检索系统的查全率;
27.分类任务有:二分类,多分类,多标签分类

试题解析:
多分类任务一般有以下几种情况:垃圾邮件判别——是/否(二分类),情绪识别——愤怒/高兴/平静(多分类),新闻主题标签——体育,C罗,欧冠(多标签分类)
28.TTS语速太快我需要将其调整慢,我可以通过调整speech_rate的值来调整语速的快慢

试题解析:
speech_rate值的大小可以调整语速,值越大语速越快,具体用法为<speak speech_rate=100>调整说话速度</speak>
29.文本语言生成在神经网络模型上存在一字随机性,但风险是可控的

试题解析:
文本语言生成在神经网络模型上存在一字随机性,但有不可控的风险
30.用户画像是属于多标签分类

试题解析:
用户画像—>性别,年龄,职业,会员等级(一个用户可以有多个标签类型)
31.如何建立语音评测集

试题解析:
语音测试集一般包含业务真实数据、随机抽、代表性、一般1~2小时左右有效数据。
并且语音需要有对应的标注文本(也就是语音对应正确的文字答案)。
32.如何得到质量更高的数据

试题解析:
质量更高的数标准:类别之间边界明确,没有噪音的数据,训练数据样本平衡,负向样本充足种类丰富
33.TTS常见的错误有()和()

试题解析:
TTS常见的错误
1、读音错误,主要两块text normalization,Pronunciation tagger
2、停顿错误,主要两块word breaker,Break tagger
34.以下哪些算是没有噪音的数据

试题解析:
没有噪音的数据主要包括完整性,明确性,存在实际意义等