本文总结分享了什么是模型、模型的分类、建立模型的方法和步骤以及具体案例。
在产品经理10大基础技能系列文章的上篇文章《 产品经理10大基础技能(1):读透SQL》中,笔者LineLian提到过模型概况,本篇文章着重介绍产品经理如何理解模型?在团队建立模型的过程中产品经理应该懂哪些知识点?然后用口罩需求量的案例展示建立模型的过程和思路。
一、模型的定义
模型与算法在某种程度上指的是一回事,就像日常生活中你问是先有鸡还是先有蛋。模型是使用数学概念和语言来对一个系统的描述。创建模型的过程叫做建模。
二、模型的分类
模型通常由关系与变量组成。关系可用算符描述,例如代数算符、函数、微分算符等。变量是关注的可量化的系统参数的抽象形式。算符可以与变量相结合发挥作用,也不可以不与变量结合。
通常情况下,模型可被分为以下几类:
线性与非线性:在模型中,如果所有变量表现出线性关系,由此产生的模型为线性模型。否则,就为非线性模型。
静态与动态:动态模型对系统状态随时间变化情况起作用,而静态(或稳态)模型是在系统保持平稳状态下进行计算的,因而与时间无关。动态模型通常用微分方程描述。
显式与隐式:如果整体模型的所有输入参数都已知,且输出参数可以由有限次计算求得(称为线性规划,不要与上面描述的线性模型相混淆),该模型称作显式模型。
离散与连续:离散模型将对象视作离散的,例如分子模型中的微粒,又如概率模型中的状态。而连续模型则由连续的对象所描述,例如管道中流体的速度场,固体中的温度和压力,电场中连续作用于整个模型的点电荷等。
确定性与概率性(随机性):确定性模型是所有变量集合的状态都能由模型参数和这些变量的先前状态唯一确定的一种模型;因此,在一组给定的初始条件下确定性模型总会表现相同。相反,在随机模型(通常成为“概率模型”)中存在随机性,而且变量状态并不能用唯一值来描述,而用概率分布来描述。
演绎,归纳与漂移:演绎模型是创建在理论上的一种逻辑结构。归纳模型由实证研究及演绎模型推广而得。漂移模型则既不依赖于理论,也不依赖于观察,而仅仅是对预期结构的调用。
当然模型还有从其他维度划分的方式,例如从机器学习的维度又可以分为:有监督的模型、无监督的模型和半监督的模型。
本篇按分类所举的案例属于线性和非线性的第一类模型。
三、建立模型的方法和步骤
一般来说建模过程可用如下框图来表明:
系统拆分建模方法和步骤如下:
1. 模型准备
要了解产品的业务需求实际背景,明确建模目的,搜集必需的各种信息,尽量弄清需求的特征。
2. 模型假设
根据对象的特征和建模目的,对产品业务需求进行必要的、合理的简化,用精确的语言作出假设,是建模至关重要的一步。如果对问题的所有因素一概考虑,无疑是一种有勇气但方法欠佳的行为,所以高超的建模者能充分发挥想象力、洞察力和判断力 ,善于辨别主次,而且为了使处理方法简单,应尽量使问题线性化、均匀化。
3. 模型构成
根据所作的假设分析对象的因果关系,利用对象的内在规律和适当的数学工具,构造各个量间的等式关系或其它数学结构。建立模型是为了让更多的人明了并能加以应用,因此工具愈简单愈有价值。
4. 模型求解
可以采用解方程、画图形、证明定理、逻辑运算、数值运算等各种传统的和近代的数学方法,特别是运用计算机技术以及云计算、和算力芯片技术。
5. 模型分析
对模型解答进行数学上的分析。“横看成岭侧成峰,远近高低各不同”,能否对模型结果作出细致精当的分析,决定了你的模型能否达到更高的档次。还要记住,不论那种情况都需进行误差分析,数据稳定性分析。
四、建立数学模型的实例
本篇案例文章笔者LineLian以“N95口罩销量”为背景,通过背景分析、数据收集、数据分析、数学建模、获得结论等过程,得到牛顿冷却模型。
1. 背景分析
背景本案例用新冠病毒背景下用户购买口罩预防病毒,假设病毒传染到达高峰以后,用户对口罩的需求数据到达无病毒状态下的正常值模型探索。
2. 数据收集
收集50天内口罩13个区域的口罩总计销售数据。采集数据如下表所示:
在数据收集中数据产品经理要明白如下知识点:
设时间为x,口罩销量为y,从上表中的数据来看,x,y的取值范围是什么?
自变量x∈【0,50】,因变量y∈【50,99】。
3. 数据分析
数据分析是一种统计方法,其主要特点是多维性和描述性。有些几何方法有助于揭示不同的数据之间存在的关系,并绘制出统计信息图,以更简洁的解释这些数据中包含的主要信息。
本案例是口罩销量在病毒感染数到达峰值后,口罩销量和时间是单值对应的,专业的数据产品经理能够引导团队选择合适的函数模型来描述两者的关系。
例如画出口罩销量随时间变化的大致图像如下:
数据产品经理需要懂的知识点是,具备一些行业数据分析需要的图形化思维。
4. 模型选择
数据产品经理在模型选择阶段主要懂得知识点是,多储备一些自己行业所需要的模型。例如口罩销量随着疫情被控制而下降案例中,我们可以从一次函数模型尝试,y=kx+b (其中K≠0),我们肯定都知道,当K>0直线上升,当k<0,直线下降,均不符合口罩在无重大疫情下最终趋于一个常量的特征。
那么常见的二次函数模型y=ax²+bx+c(其中a≠0),能描述口罩随着疫情被控制随着时间下降的变化趋势吗?也不行,不论开口向上还是向下,当x->+∞时,y->∞,与随着时间的增加口罩销量下降并最终趋于一个向量相矛盾。
同样的,对数函数模型y=m loga x 也不符合。因此可以选择单调下降的指数函数模型y=ma x(其中0<a<1,m>0)。
数据产品经理在模型选择中通过层层启发,各个击破,充分培养适合的模型的直观感知、直觉判断意识和能力。
5. 模型建立
确定指数函数模型y=ma x(其中0<a<1,m>0)。
根据收集的数据,利用Python或者Excel或者其他工具进行精确计算,由计算机自动生成指数函数:y=93.287e -0.014x。
6. 模型检验
根据函数的图像性质推断,指数函数的图像的发展趋势比较符合口罩随疫情高峰时间后的变化规律,如下图:
但指数函数模型也存在有明显不足,当x趋于正无穷大时,y趋于0。事实上,没有疫情下口罩的销量将趋于一个正常值。
设计意图,数据建模给出一种研究问题的方法:从基本假设出发,而非从假想结论出发,用严谨的数据方法去分析,结合数据挖掘现象背后的数学规律。
从而产品经理大胆提出质疑,发表自己的意见。
7. 模型建立总结
拟合类函数建立模型时一般可以按以下程序进行操作:
在根据数据特点选择模型函数时,由于产品业务问题本身的复杂性、开放性,所选择的模型会有局限性,需要对模型的解进行检验或修正;有时由于从收集的数据中选择的数据不同,得到的拟合模型结果会有所差别,但只要误差在允许的范围内就认为是何时的。
最后小结
随着各个公司对数据的重视,产品经理会无一例外的逐步变成全是懂数据的产品经理,提的产品需求也讲全部用数据说话。而运用数据的过程也是建立模型的过程。先理解产品的业务需求,然后再建模的过程中配置模型工程师决定每个数据的产品业务意义,然后用模型的结果来为产品做决策。
如果你想系统化入门AI产品经理,掌握AI产品经理的落地工作方法,戳这里>http://996.pm/7bjab