时间

建模时间:3日(周五9点)-6日(周一9点)

C题需要学习的

C题比较简单,咱们大概率写C题
C题主要是数据分析,数据预测
主要常考模型:

  1. 相关性分析
  2. 灵敏度分析
  3. 预测模型
  4. 数据处理

历年来C题思路

2022年C题思路,看看即可:
https://mp.weixin.qq.com/s/IPYy7yodxUa44knZL8B9Qw

目前需要做的

  1. 看历年C题论文,包括优秀论文
  2. 熟悉掌握那个网站使用
  3. 看一下清风的课:把他的前几个小时看了
  4. 清风有个论文课,把前两个小时看了
  5. 课不想看的话就不看了,直接找历年C题优秀论文自己看

公众号

数模备赛指南
https://mp.weixin.qq.com/s/UtlDK-4CZONYgHLAsGiFzQ

任务分配

建模时各个人员主要任务:
付昌威:辅助论文,辅助解题,找代码,找图片,excel数据处理,论文润色
边锦华:主攻论文,付昌威辅助,辅助解题
方啸阳:主攻解题思路,杂项论文(假设检验啥的)

论文模板使用清风给的

时间预估:

  • 9-7是晚上:尽量把题的解题思路全部搞出来 咱们三个疯狂查找对应文献,找到nb的一起讨论,是否开腾讯会议啥的,需要按情况处理。最晚12点睡
  • 9-8:第一题,第二题解出来
  • 9-9:第三题,第四题解出来,晚上可以通宵了
  • 9-10:其余部分写完,下午论文润色,查重

C题感悟:

今天也是分享一个国赛C题的一个自己小感悟。

  • 第一点,这个统计题型啊,很重要的一点就是数据的处理了,包含异常值的剔除、数据的筛选、数据的补全等。
  • 第二点,这个题型用的模型得是准确的,这个模型是指在建立模型的时候考虑三个检验,一是统计检验如T、F检验,二是模型拟合优度,三是模型统计学意义。
  • 第三点,在2021C题和2020C题中,可以用的两个重要的数学模型,回归分析和规划类,前者数据量不大,提出多个指标建立模型,后者数据量非常大,也是提出多个指标建立模型,同样最重要的事就是数据的预处理。
  • 第四点,在这个题型中参考文献在5个以上10个以内,要引用的论文中的语句自己修改,避免查重。经过对2021C和2020C题,我们可以发现,很多指标不都是自己想的,而是大佬文献里直接找的。先传统后机器学习,
  • 第五点,用传统数学模型,然后进行求解,不进行解释为什么不推荐用机器学习,能用传统数学模型和思维去做写来下就是好的。
  • 然后因为这个题型的难度不大,所以到比赛的时候这个题出解析的人会很多,如果去查找的话,或多或少都会影响自己的做题思路。这个发解析的都是会被赛方拉入黑名单的,论文里面跟那里面的内容大部分相似的话就涉嫌抄袭,就没资格了。

注意的点:

数据相关性分析之前做正态检验,具体需要做什么相关性分析自己去csdn上查找方法,问问度娘运用这个方法之前是不是要做什么检验。
结果解释,要对分析之后的结果进行解释,如妈妈吸烟等多个指标对胎儿健康程度的影响,相关性分析之后就可以说,吸烟影响胎儿健康。
多找指标,看完题后,多次分析背景和题目,三个组员再去文献里找指标,然后再讨论。

C题的一个大致流程:

  • 数据的预处理,剔除或者补全。
  • 指标的确定,指标下定义。
  • 指标的筛选,通过相关性。这种题一般都要求量化。
  • 理论模型的建立,传统优先。
  • 模型的检验。(不通过检验就修正)
  • 模型的修正
  • 算法的设计,思路。

大致也就是这样,国赛C题难度不高,要多去文献和通过自己的脑瓜子想指标。

碎碎念:

  1. 正常来说是三个人在一起去搞,不过由于我俩是班导,大概率在不了一起。
  2. 那个网站可以相信一部分,这几天必须会搞明白那个网站如何使用。
  3. 论文中会有高级公式,这个付昌威来。
  4. 那个网站如果用的好的话,完全可以相信,关键你要用的好。
  5. 最后不要忘记知网查重