时间

建模时间：3日(周五9点)-6日(周一9点)

C题需要学习的

C题比较简单，咱们大概率写C题
C题主要是数据分析，数据预测
主要常考模型：

相关性分析
灵敏度分析
预测模型
数据处理

历年来C题思路

2022年C题思路，看看即可：
https://mp.weixin.qq.com/s/IPYy7yodxUa44knZL8B9Qw

目前需要做的

看历年C题论文，包括优秀论文
熟悉掌握那个网站使用
看一下清风的课：把他的前几个小时看了
清风有个论文课，把前两个小时看了
课不想看的话就不看了，直接找历年C题优秀论文自己看

公众号

数模备赛指南
https://mp.weixin.qq.com/s/UtlDK-4CZONYgHLAsGiFzQ

任务分配

建模时各个人员主要任务：
付昌威：辅助论文，辅助解题，找代码，找图片，excel数据处理，论文润色
边锦华：主攻论文，付昌威辅助，辅助解题
方啸阳：主攻解题思路，杂项论文(假设检验啥的)

论文模板使用清风给的

时间预估：

9-7是晚上：尽量把题的解题思路全部搞出来咱们三个疯狂查找对应文献，找到nb的一起讨论，是否开腾讯会议啥的，需要按情况处理。最晚12点睡
9-8：第一题，第二题解出来
9-9：第三题，第四题解出来，晚上可以通宵了
9-10：其余部分写完，下午论文润色，查重

C题感悟：

今天也是分享一个国赛C题的一个自己小感悟。

第一点，这个统计题型啊，很重要的一点就是数据的处理了，包含异常值的剔除、数据的筛选、数据的补全等。
第二点，这个题型用的模型得是准确的，这个模型是指在建立模型的时候考虑三个检验，一是统计检验如T、F检验，二是模型拟合优度，三是模型统计学意义。
第三点，在2021C题和2020C题中，可以用的两个重要的数学模型，回归分析和规划类，前者数据量不大，提出多个指标建立模型，后者数据量非常大，也是提出多个指标建立模型，同样最重要的事就是数据的预处理。
第四点，在这个题型中参考文献在5个以上10个以内，要引用的论文中的语句自己修改，避免查重。经过对2021C和2020C题，我们可以发现，很多指标不都是自己想的，而是大佬文献里直接找的。先传统后机器学习，
第五点，用传统数学模型，然后进行求解，不进行解释为什么不推荐用机器学习，能用传统数学模型和思维去做写来下就是好的。
然后因为这个题型的难度不大，所以到比赛的时候这个题出解析的人会很多，如果去查找的话，或多或少都会影响自己的做题思路。这个发解析的都是会被赛方拉入黑名单的，论文里面跟那里面的内容大部分相似的话就涉嫌抄袭，就没资格了。

注意的点：

数据相关性分析之前做正态检验，具体需要做什么相关性分析自己去csdn上查找方法，问问度娘运用这个方法之前是不是要做什么检验。
结果解释，要对分析之后的结果进行解释，如妈妈吸烟等多个指标对胎儿健康程度的影响，相关性分析之后就可以说，吸烟影响胎儿健康。
多找指标，看完题后，多次分析背景和题目，三个组员再去文献里找指标，然后再讨论。

C题的一个大致流程：

数据的预处理，剔除或者补全。
指标的确定，指标下定义。
指标的筛选，通过相关性。这种题一般都要求量化。
理论模型的建立，传统优先。
模型的检验。（不通过检验就修正）
模型的修正
算法的设计，思路。

大致也就是这样，国赛C题难度不高，要多去文献和通过自己的脑瓜子想指标。

碎碎念：

正常来说是三个人在一起去搞，不过由于我俩是班导，大概率在不了一起。
那个网站可以相信一部分，这几天必须会搞明白那个网站如何使用。
论文中会有高级公式，这个付昌威来。
那个网站如果用的好的话，完全可以相信，关键你要用的好。
最后不要忘记知网查重