注 意 事 项
1、本试卷依据《人工智能训练师》国家职业标准命制。2、请根据试题考核要求,完成考试内容。3、参赛选手在竞赛过程中应该遵守相关的规章制度和安全守则,如有违反,则按照相关规定在竞赛的总成绩中扣除相应分值。
任务要求
1、任务名称:
任务1:数据采集和处理
任务2:任务分析和模型训练
任务3:智能系统设计和维护
本题分值:30分
考试时间:40min
考试形式:实操
考核内容:
你正在为一个情感分析项目准备数据。数据来自用户评论,需要采集、清洗和标注情感标签(正面、负面、中性)。请考生在桌面上新建一个文件夹,将新建的文件夹命名为“参赛号+题号”,将以下内容保存为sentences.txt文件,根据要求完成以下任务,将完成的任务(包含但不限于截图、文档、程序等)保存至上述新建的“参赛号+题号”中:
I love this product.
This is terrible.
It's okay.
Great service!
Not good.
Amazing quality.
Poor experience.
Neutral comment here.
问题1:使用Python读取sentences.txt文件,并显示文件中的所有句子;要求:编写代码,输出所有句子(每行一个句子)。将结果保存为Q1-1。
问题2:对句子进行清洗,包括转换为小写、去除标点符号(如句点、感叹号等)。显示清洗后的前3个句子。要求:编写代码,输出清洗后的结果。将结果保存为Q1-2。
问题3:题目:基于关键词自动为每个句子标注情感标签(正面、负面、中性),并保存到CSV文件labeled_data.csv中。标签规则:
正面:包含"love"、"great"、"amazing"等关键词。
负面:包含"terrible"、"not good"、"poor"等关键词。
中性:其他情况。
要求:编写代码,输出标注后的数据(包括原句和标签),并保存为CSV文件。将结果保存为Q1-3.
本题分值:40分
考试时间:60min
考试形式:实操
考核内容:
使用鸢尾花数据集(Iris dataset)训练一个分类模型,以预测鸢尾花的种类。数据集可通过scikit-learn库直接加载。请考生在桌面上新建一个文件夹,将新建的文件夹命名为“参赛号+题号”,根据要求完成以下任务,将完成的任务(包含但不限于截图、文档、程序等)保存至上述新建的“参赛号+题号”中:
问题1:加载鸢尾花数据集,分析数据特征和目标变量,显示数据形状、前5行样本以及目标变量的分布。要求:编写代码,输出数据基本信息。将结果保存为Q2-1
问题2:将数据分为训练集和测试集(80%训练,20%测试),使用逻辑回归模型进行训练,并输出模型在训练集上的准确率。要求:编写代码,完成数据分割和模型训练。将结果保存为Q2-2
问题3:在测试集上评估模型性能,计算准确率并显示混淆矩阵。要求:编写代码,输出测试集准确率和混淆矩阵。将结果保存为Q2-3
本题分值:30分
考试时间:20min
考试形式:实操
考核内容:
你正在为一个电影流媒体平台设计一个简单的电影推荐系统。系统需要根据用户的喜好推荐电影,并能够根据用户反馈不断优化推荐结果。数据文件movies.csv已提供,请考生在桌面上新建一个文件夹,将新建的文件夹命名为“参赛号+题号”,将以下内容保存为movies.csv文件,根据要求完成以下任务,将完成的任务(包含但不限于截图、文档、程序等)保存至上述新建的“参赛号+题号”中:
title,genre,rating,duration
The Shawshank Redemption,Drama,9.3,142
The Godfather,Crime,9.2,175
The Dark Knight,Action,9.0,152
Pulp Fiction,Crime,8.9,154
Forrest Gump,Drama,8.8,142
Inception,Sci-Fi,8.8,148
The Matrix,Sci-Fi,8.7,136
Goodfellas,Crime,8.7,146
The Silence of the Lambs,Thriller,8.6,118
Saving Private Ryan,War,8.6,169
问题1:设计一个基于电影类型的推荐系统架构。编写代码加载movies.csv数据,分析数据特征,并描述推荐系统的三个主要组件。要求:1、加载并显示电影数据的基本信息;2、分析不同类型电影的数量分布;3、描述推荐系统的三个核心组件及其功能;将结果保存为Q3-1.
问题2:实现一个简单的基于类型的电影推荐函数。用户输入喜欢的电影类型,系统返回该类型中评分最高的3部电影。要求:1、编写推荐函数,根据类型筛选电影;2、按评分从高到低排序;3、返回指定数量的推荐结果;将结果保存为Q3-2.
问题3:系统需要扩展以支持新的电影类型"Comedy",并添加相应的电影数据。同时,优化推荐算法,考虑电影时长因素(用户可能偏好特定时长的电影)。要求:1、添加新的喜剧电影数据;2、修改推荐函数,支持时长偏好过滤;3、测试优化后的推荐系统;结果保存为Q3-3.