主讲人:魏永强(清华大学博士后)
课程背景
随着数字化时代的到来,银行零售中台的技术人员需要具备数据驱动和分析能力,以应对不断变化的业务需求和挑战。本课程旨在培养银行零售中台技术人员在数据驱动与分析方面的能力,包括根据不同场景和业务诉求选择合适的数据驱动方式和路径,深入理解数据挖掘的有监督和无监督模型,并掌握应用场景、评估标准和优化方向。同时,课程还将涵盖Mysql和Hive的高阶功能,Excel的数据处理和数据透视表,以及数据可视化工作中的使用。
课程目标
1. 培养学员具备场景思维,能够根据不同场景和业务诉求选择合适的数据驱动方式和路径。
2. 深入理解数据挖掘的有监督和无监督模型,并了解其应用场景、评估标准和优化方向。
3. 掌握Mysql和Hive的高阶功能,包括正则表达式、窗口函数等,并具备数据处理和优化的意识。
4. 熟练运用Excel进行数据处理,包括查询函数、if族函数、数据透视表等,并能够使用R、SPSS、Python或其他统计软件进行大型数据处理工作。
5. 熟练运用Office软件(Excel和PPT)进行数据可视化工作,并能够根据不同场景选择合适的可视化方案。
授课形式
1.理论讲解:通过专业讲师对课程内容进行详细解释和阐述,帮助学员建立起对银行零售中台技术人员数据驱动与分析能力的基本理论框架和知识体系。
2.案例分析:引入银行零售中台技术人员数据驱动与分析能力的应用案例,结合课程内容进行案例分析,让学员深入了解成功案例的关键要素、实施过程和效果,从中汲取经验和启示。
3.小组讨论:将学员分成小组,针对特定话题或案例进行讨论,促进学员之间的互动交流,加深对课程内容的理解,并共同探讨解决方案。
4.实践演练:通过模拟情境、角色扮演等方式,让学员参与到银行零售中台技术人员数据驱动与分析能力的应用过程中,提供实践机会,培养解决问题的能力和实际操作的技巧。
5.视频分享:分享相关领域的优秀视频资源,展示行业内的最新趋势、创新案例和成功经验,激发学员的思考和启发灵感。
6.课堂练习:课堂上进行针对性的练习和小测试,巩固学员对课程内容的掌握程度,帮助学员更好地理解和应用所学知识。
7.小组研讨:学员分组进行研讨,共同解决实际问题或提出创新想法,通过合作和协作,培养团队合作精神和解决问题的能力。
8.互动答疑:课程中设置专门的时间进行问题解答和答疑环节,学员可以提出自己的疑问和困惑,与讲师和其他学员进行互动交流,获得解答和指导。
课程大纲
第1章 数据驱动与分析概述
1.1 数据驱动在银行零售中台的重要性与作用:可以通过实际案例或数据来说明数据驱动在银行零售中台的决策优化、客户细分、产品推荐等方面的重要作用。
1.2 数据分析在业务决策中的应用价值:可以列举一些数据分析在业务决策中的具体应用,如市场趋势分析、客户行为预测、产品优化等。
1.3 场景思维与数据驱动的关系:可以解释场景思维如何帮助我们发现问题、提取需求、设计解决方案,并如何将场景思维应用到数据驱动中。
第2章 数据挖掘的有监督模型
2.1 有监督学习的概念与应用场景:解释有监督学习的概念,并通过实际案例来说明其在分类、回归等任务中的应用。
2.2 常见的有监督学习算法:列举并解释常见的有监督学习算法,如线性回归、逻辑回归、支持向量机、决策树、随机森林等。
2.3 模型评估与优化方向:介绍模型评估的标准和方法(如准确率、精确率、召回率等),以及如何根据评估结果优化模型。
第3章 数据挖掘的无监督模型
3.1 无监督学习的概念与应用场景:解释无监督学习的概念,并通过实际案例来说明其在聚类、降维、关联规则挖掘等任务中的应用。
3.2 常见的无监督学习算法:列举并解释常见的无监督学习算法,如K-means、主成分分析(PCA)、Apriori 等。
3.3 模型评估与优化方向:介绍模型评估的标准和方法(如轮廓系数、互信息等),以及如何根据评估结果优化模型。
第4章 Mysql 和 Hive 高阶功能
4.1 正则表达式在数据处理中的应用:介绍正则表达式的基本语法和使用方法,并通过实际案例来说明其在数据处理中的应用。
4.2 窗口函数的概念与用法:介绍窗口函数的概念,并通过实际案例来说明其在数据处理中的应用。
4.3 数据处理的优化意识与技巧:介绍一些数据处理的优化意识和技巧,如索引优化、分页优化、慢查询优化等。
第5章 Excel 数据处理与数据透视表
5.1 查询函数在数据处理中的应用:介绍一些常用的查询函数(如VLOOKUP、INDEX、MATCH 等),并通过实际案例来说明其在数据处理中的应用。
5.2 if 族函数的使用技巧:介绍 if 族函数(如 IF、IFERROR、IFNA 等)的使用方法和技巧。
5.3 数据透视表的构建与分析:介绍数据透视表的概念和构建方法,并通过实际案例来说明如何使用数据透视表进行数据分析。
第6章 大型数据处理工作的工具与技术
6.1 R、SPSS、Python 等统计软件的使用与数据处理案例:介绍 R、SPSS、Python 等统计软件的使用方法和技巧,并通过实际案例来说明其在大型数据处理中的应用。
6.2 大型数据处理的技术与方法:介绍一些大型数据处理的技术和方法,如分布式计算、数据并行处理、内存优化等。
6.3 其他统计软件的选择与使用:介绍一些其他统计软件(如SAS、Stata、MATLAB 等)的选择和使用方法。
第7章 数据可视化工作的基础与技巧
7.1 Office 软件在数据可视化中的应用:介绍 Office 软件(如 Excel、PowerPoint 等)在数据可视化中的应用方法和技巧。
7.2 Excel 绘图和图表设计技巧:介绍 Excel 绘图和图表的设计技巧,如图表类型选择、颜色搭配、标题和图例设置等。
7.3 PPT 制作与演示技巧:介绍 PPT 的制作和演示技巧,如幻灯片布局、字体和颜色选择、动画和过渡效果等。
第8章 数据可视化方案的选择与应用
8.1 不同场景下的数据可视化需求:介绍不同场景下的数据可视化需求,如数据探索、数据报告、数据故事等。
8.2 选择合适的可视化工具和技术:根据不同场景下的数据可视化需求,选择合适的可视化工具和技术,如Excel、Tableau、PowerBI 等。
8.3 数据可视化案例分析与实践:通过实际案例来说明如何选择合适的可视化工具和技术进行数据可视化。
第9章 数据质量与清洗
9.1 数据质量的重要性与影响因素:讲解数据质量对于数据驱动分析和决策的重要性,并介绍一些影响数据质量的因素,如数据来源、数据收集方法、数据存储等。
9.2 数据清洗的基本步骤与方法:介绍数据清洗的基本步骤,如数据预处理、数据转换、数据校验等,并讲解一些常见的数据清洗方法,如缺失值处理、异常值检测、重复值删除等。
9.3 数据清洗的常见问题与解决方案:通过实际案例分析,讲解数据清洗过程中可能遇到的问题,如数据类型不一致、数据格式不统一等,并提出相应的解决方案。
第10章 数据隐私与安全
10.1 数据隐私保护的法律法规与规范:介绍我国相关的数据隐私保护法律法规,如《中华人民共和国网络安全法》、《个人信息保护法》等,并讲解一些行业规范和标准,如ISO27001、GDPR 等。
10.2 数据安全的风险与防护措施:分析数据安全可能面临的风险,如数据泄露、数据篡改、数据入侵等,并提出相应的防护措施,如加密技术、访问控制、数据备份等。
10.3 数据安全管理的最佳实践与应用:通过实际案例,讲解数据安全管理的最佳实践,如建立数据安全管理制度、进行数据安全培训、制定数据安全策略等,并分享一些数据安全技术的应用实例。
授课老师
魏永强 清华大学五道口金融学院博士后
常驻地:北京
邀请老师授课:13439064501 陈助理