常熟市高技能人才协会

注 意事项

1、本试卷依据《人工智能训练师》国家职业标准命制。2、请根据试题考核要求，完成考试内容。3、参赛选手在竞赛过程中应该遵守相关的规章制度和安全守则，如有违反，则按照相关规定在竞赛的总成绩中扣除相应分值。

任务要求

1、任务名称：

任务1：数据采集和处理

任务2:任务分析和模型训练

任务3：智能系统设计和维护

试题一、数据采集和处理

本题分值：30分

考试时间：40min

考试形式：实操

考核内容：

你正在为一个情感分析项目准备数据。数据来自用户评论，需要采集、清洗和标注情感标签（正面、负面、中性）。请考生在桌面上新建一个文件夹，将新建的文件夹命名为“参赛号+题号”，将以下内容保存为sentences.txt文件，根据要求完成以下任务，将完成的任务（包含但不限于截图、文档、程序等）保存至上述新建的“参赛号+题号”中：

I love this product.

This is terrible.

It's okay.

Great service!

Not good.

Amazing quality.

Poor experience.

Neutral comment here.

问题1:使用Python读取sentences.txt文件，并显示文件中的所有句子；要求：编写代码，输出所有句子（每行一个句子）。将结果保存为Q1-1。

问题2：对句子进行清洗，包括转换为小写、去除标点符号（如句点、感叹号等）。显示清洗后的前3个句子。要求：编写代码，输出清洗后的结果。将结果保存为Q1-2。

问题3:题目：基于关键词自动为每个句子标注情感标签（正面、负面、中性），并保存到CSV文件labeled_data.csv中。标签规则：

正面：包含"love"、"great"、"amazing"等关键词。

负面：包含"terrible"、"not good"、"poor"等关键词。

中性：其他情况。
要求：编写代码，输出标注后的数据（包括原句和标签），并保存为CSV文件。将结果保存为Q1-3.

二、任务分析和模型训练

本题分值：40分

考试时间：60min

考试形式：实操

考核内容：

使用鸢尾花数据集（Iris dataset）训练一个分类模型，以预测鸢尾花的种类。数据集可通过scikit-learn库直接加载。请考生在桌面上新建一个文件夹，将新建的文件夹命名为“参赛号+题号”，根据要求完成以下任务，将完成的任务（包含但不限于截图、文档、程序等）保存至上述新建的“参赛号+题号”中：

问题1：加载鸢尾花数据集，分析数据特征和目标变量，显示数据形状、前5行样本以及目标变量的分布。要求：编写代码，输出数据基本信息。将结果保存为Q2-1

问题2：将数据分为训练集和测试集（80%训练，20%测试），使用逻辑回归模型进行训练，并输出模型在训练集上的准确率。要求：编写代码，完成数据分割和模型训练。将结果保存为Q2-2

问题3：在测试集上评估模型性能，计算准确率并显示混淆矩阵。要求：编写代码，输出测试集准确率和混淆矩阵。将结果保存为Q2-3

试题三、智能系统设计和维护

本题分值：30分

考试时间：20min

考试形式：实操

考核内容：

你正在为一个电影流媒体平台设计一个简单的电影推荐系统。系统需要根据用户的喜好推荐电影，并能够根据用户反馈不断优化推荐结果。数据文件movies.csv已提供，请考生在桌面上新建一个文件夹，将新建的文件夹命名为“参赛号+题号”，将以下内容保存为movies.csv文件，根据要求完成以下任务，将完成的任务（包含但不限于截图、文档、程序等）保存至上述新建的“参赛号+题号”中：

title,genre,rating,duration

The Shawshank Redemption,Drama,9.3,142

The Godfather,Crime,9.2,175

The Dark Knight,Action,9.0,152

Pulp Fiction,Crime,8.9,154

Forrest Gump,Drama,8.8,142

Inception,Sci-Fi,8.8,148

The Matrix,Sci-Fi,8.7,136

Goodfellas,Crime,8.7,146

The Silence of the Lambs,Thriller,8.6,118

Saving Private Ryan,War,8.6,169

问题1：设计一个基于电影类型的推荐系统架构。编写代码加载movies.csv数据，分析数据特征，并描述推荐系统的三个主要组件。要求：1、加载并显示电影数据的基本信息；2、分析不同类型电影的数量分布；3、描述推荐系统的三个核心组件及其功能；将结果保存为Q3-1.

问题2：实现一个简单的基于类型的电影推荐函数。用户输入喜欢的电影类型，系统返回该类型中评分最高的3部电影。要求：1、编写推荐函数，根据类型筛选电影；2、按评分从高到低排序；3、返回指定数量的推荐结果；将结果保存为Q3-2.

问题3：系统需要扩展以支持新的电影类型"Comedy"，并添加相应的电影数据。同时，优化推荐算法，考虑电影时长因素（用户可能偏好特定时长的电影）。要求：1、添加新的喜剧电影数据；2、修改推荐函数，支持时长偏好过滤；3、测试优化后的推荐系统；结果保存为Q3-3.

2025常熟市职业技能竞赛人工智能训练师赛项技能操作样题

发布日期：2025-10-17

试题一、数据采集和处理

二、任务分析和模型训练

试题三、智能系统设计和维护

2025常熟市职业技能竞赛 人工智能训练师赛项技能操作样题

发布日期：2025-10-17

试题一、数据采集和处理

二、任务分析和模型训练

试题三、智能系统设计和维护

2025常熟市职业技能竞赛人工智能训练师赛项技能操作样题