实验室介绍
大数据分析与智能计算实验室占地面积145.32平方米,可同时供110名学生使用。该实验室主要对数据科学与大数据技术专业全体师生及参加挑战杯、互联网+、团体程序设计天梯赛、大数据挑战赛和蓝桥杯大赛等竞赛的师生开放。实验室电脑均安装C/C++、Python、Java、Qt等多种开发工具及大数据实践教学本地化平台和大数据人工智能一体化平台,可满足大数据等专业学生开展企业大数据项目实践系列教学的需求。实验项目内容包括验证性实验、设计性实验、综合性实验及创新性实验。通过实验,学生不仅熟练掌握各种开发工具,提高解决问题的能力,还可以提升程序设计开发与应用、数据分析与处理算法等方面的创新能力,培养出符合产业发展需求的大数据技术人才,增强专业学生就业竞争力。
承接实验课程
大数据分析与智能计算实验室承接了数据科学与大数据技术专业方向所讲授的大部分专业课程。内容包括程序设计系列课程、数据库系列课程、大数据系列课程和企业大数据项目实践系列等。实验室资源包含实验操作所需的实验手册、教学课件、教学视频及配套的环境资源,能够指导学生独立完成课程实验。
序号 | 承接课程 | 对应课程简单描述 |
1 | 问题求解与程序设计 | 课程实验内容主要包括: 选择结构、循环结构while语句、for语句、 函数编程、一维数组、二维数组、字符数组、指针、结构体、动态数组和链表及文件实验。 |
2 | 大数据与智能计算基础 | 课程实验内容主要包括: Python控制结构、函数、类与对象、文件、数据库、Matplotlib数据可视化、GUI、数据采集等 |
3 | C++程序设计 | 课程实验内容主要包括: 类和对象、构造函数和析构函数、静态变量和友元函数、继承和派生、STL、文件、数据库、界面开发等 |
4 | Java应用程序开发基础 | 课程实验内容主要包括: Java开发环境配置、Java语言基础、Java文件系统(输入输出流)、图形界面GUI设计及事件处理、Java企业级项目开发等 |
5 | 数据库系统及应用 | 课程实验内容主要包括: 数据库设计、数据库定义、数据库备份还原、数据查询、数据添加、数据修改、数据删除、视图与存储过程、触发器、数据库安全性控制、事务处理等 |
6 | 数据采集与清洗 | 课程实验内容主要包括: 利用requests爬取网站职位信息、图书详细信息爬虫、商品信息爬虫、自动化爬取网页信息、异步爬取动态网页信息、职业数据清洗及可视化等 |
7 | 数据结构与算法分析 | 课程实验内容主要包括: 顺序表、链表、栈和队列、串的模式匹配、二叉树创建及遍历、二叉树线索化、图的遍历、最小生成树、最短路径、查找、排序、经典算法分析等 |
8 | 数据仓库原理及实践 | 课程实验内容主要包括: 基于石油大数据离线场景下的数据平台项目,依据用户行为日志业务及其主要需求指标,解决大数据平台在数据治理方向上的全流程技术链路,主要包括了数据采集、数仓构建、分布式计算及优化、计算任务调度及BI可视化。 |
9 | 阿里大数据技术应用与实践 | 课程实验内容主要包括: DataWorks数据操作、QuickBI数据分析及报表制作、DataV可视化大屏、机器学习实现分类实验等 |
10 | 企业大数据项目实践1-数据采集与存储 | 实践内容包括: Python爬虫环境与网页前端基础、简单静态网页爬取、常规动态网页爬取、requests模块应用、Scrapy爬虫、数据存储与数据库设计等 |
11 | 企业大数据项目实践2-数据可视化 | 实践内容包括: Matplotlib数据可视化、Seaborn数据可视化、ECharts数据可视化、Falsk数据封装与可视化及基于B/S和C/S可视化大屏项目开发等 |
12 | 企业大数据项目实践3-大数据分析 | 实践内容包括: Spark集群环境安装实践、PySpark基本操作 Spark机器学习库学习,包括回归、分类、协同过滤以及聚类、数据集的特征提取以及降维 PySpark逻辑回归项目应用、PySpark的决策树模型项目应用、项目案例数据预处理以及数据分析及数据可视化等 |
13 | 企业大数据项目实践4-大数据平台构建 | 实践内容包括: 环境搭建(IDEA)、构建Hadoop大数据平台 HBase与Kafka的数据存储与交互、Flume与Hive日志采集与离线分析、Spark离线与实时数据分析、Flink离线与实时数据分析等 |
14 | 企业大数据项目实践5-大数据开发 | 实践内容包括: Spark集群环境的安装配置、PySpark RDD算子和DataFrame算子、Spark-Streaming文件流、Spark-Streaming套接字流实践、Spark MLib 机器学习算法应用,Spark Mlib 图像分类、Spark 框架数据清洗、Spark SQL数据分析及存储、Flink配置及实时计算等 |
实验环境
问题求解与程序设计、C++程序设计(Visual Studio 2010、2019和DEV C++)
大数据与智能计算基础(Python、PyCharm和Anaconda)
C++工程项目开发应用(Qt)
Web前端开发技术(HTML)
软件工程(Microsoft Visio和Microsoft Project和Rational Rose)
数据库系统及应用(SQL Server、MySQL和Navicat Premium)
Java应用程序开发基础(Eclipse和IntelliJ IDEA)
原型设计工具(Axure)
虚拟软件(VirtualBox)
软件测试(LoadRunner和Selenium)
企业大数据项目实践(HDFS+YARN+MapReduce Scala+Spark)
培养学生能力
一、基础专业能力
1.数学思维能力
2.数据认知能力
3.统计分析能力
二、核心专业能力
1.大数据平台架构能力
2.大数据处理与分析能力
3.大数据建模能力
4.算法设计与优化能力
5.大数据开发能力
6.数据可视化能力
7.大模型应用能力