数据产品,是以数据为主要目标的产品,且无论是面向客户的完整产品,还是部分后端产品,都具有与其他技术产品不同的特性。
什么是数据产品,而它又为什么值得你去关心呢?
DJ Patil对数据产品的定义是:
“通过使用数据促进最终目标的产品”。
这一定义乍看起来涵盖的范围似乎相当广泛。毕竟,在大多数情况下,所有的Web产品都使用数据。它们都是使用数据来促进最终目标的实现。那现在网络上的一切都是数据产品吗?
对此,我将指出二者之间存在的一个非常重要的区别;使用数据促进最终目标的产品和主要目标是使用数据促进最终目标的产品之间的区别。
数据产品,从某种意义上说是需要有自己的类别,它们是以数据为主要目标的产品。
定义数据产品
为什么要如此拘泥于细节?嗯,我个人的观点是,数据产品,无论是面向客户的完整产品还是部分后端产品,都具有与其他技术产品不同的特性。
虽然许多标准的产品开发规则都适用——解决客户需求、从反馈中汲取经虽然许多标准的产品开发规则都适用——解决客户的需求、从反馈中学习、无情地确定优先级等等——但有些微妙之处可能会使对数据产品的思考有些不同。
上面的定义用于区分我们是否应该像通常那样考虑产品,还是我们是否需要考虑更适合数据世界的产品开发方面。
一些实例
通过这种方法,我们来举几个例子。
媒体是数据产品吗?根据我们的定义判定媒体并不是数据产品;它虽然使用数据,但它的主要目标是“……建立一个更好的发布平台——一个允许任何人向世界提供他们的故事和想法,并帮助伟大的人登上首页”。虽然数据将在这项任务中发挥关键作用,但它不是实现这一目标的主要驱动力。也不是媒体的目标,对于媒体来说,数据是达到目的的手段。
如果我们对媒体平台进行再深入一点分析,我们会发现那些通过使用数据来定义其目的的产品。媒体的搜索功能是一种数据产品。其目标是将相关文章推荐给相关读者,而数据是实现这一目标的关键。
媒体的文章订阅功能怎么样实现的呢?是的,数据,再一次在决定向读卡器显示内容时起着关键作用。
我们再举一个例子:Gmail是数据产品吗?不,Gmail是一种电子邮件服务,其主要目标是允许个人之间进行异步的书面通信。然而,Gmail将我们的电子邮件分类成重要和不重要的数据产品。主要目标是对电子邮件进行分类,这主要集中在自然语言处理上。
Instagram是数据产品吗?并不是,但如果将其视为离散产品,则其大部分功能都是数据产品-,例如:标记、搜索、发现。
谷歌分析是一种数据产品吗?是的,它的主要目标是给用户带来对在线行为的定量理解。这里的数据是与用户交互的中心,与目前提到的其他产品不同,它的使用是明确的。
数据产品的类型
显然,存在各种不同类型的数据产品。即使将可能的产品领域缩小到符合我们定义的范围之内,这些产品之间仍然存在相当大的差异性。随着这种差异性在产品开发中进一步微妙化。
我们可以将这些数据产品分为5大类:原始数据、派生数据、算法、决策支持和自动化决策。
一般来说,这些产品类型是根据日益增加的复杂性列出的。更具体一点来说,它们是根据不断增加的内部复杂性列出的,并且(应该)用户方面的复杂性较低。
换句话说,数据产品本身的计算、决策或“思考”越多,则用户需要的思考就越少。
通常(但不完全)原始数据、派生数据和算法都有技术使用者。大多数情况下,他们往往是一个组织的内部产品,但反例将包括广告交流,或API套件。决策支持和自动化决策产品往往具有更均衡的技术和非技术用户组合;尽管对于任何给定的产品,用户组往往是其中之一。
原始数据。从原始数据开始,我们收集并提供可用的数据(也许我们正在做一些小的处理或清理步骤)。然后,用户可以选择使用适当的数据,但大多数工作都是在用户完成的。
导出数据。在向用户提供派生数据时,我们在我们这边做一些处理。对于客户数据,我们可以添加其他属性,例如为每个客户分配一个客户段,或者添加他们单击广告或从某个类别购买产品的可能性。
算法。接下来我们有算法,或者算法服务。我们得到了一些数据,我们通过算法运行它-无论是机器学习还是其他-并返回信息或见解。谷歌图片就是一个很好的例子:用户上传图片,并接收一组与上传图片相同或相似的图片。在后台,该产品提取功能,对图像进行分类,并将其与存储的图像进行匹配,返回最相似的图像。
决策支持。在这里,我们希望向用户提供信息,帮助他们做出决策,但我们自己并没有做决定。分析仪表盘(如Google Analytics、Flurry或WGSN)将属于此类。我们做的大部分工作都是在我们这边进行的;我们的目的是以易于消化的格式向用户提供相关信息,以便他们做出更好的决策。在谷歌分析的案例中,这可能改变编辑策略,解决转换漏斗中的漏洞,或者双倍降低给定产品策略。这里要记住的重要一点是:虽然我们在数据收集、新数据的派生、选择要显示的数据以及如何显示这些数据等方面做出了设计决策,但是用户仍然有责任,自己解释这些数据。他们控制着对该数据采取(或不采取)行动的决定。
自动化决策。在这里,我们将给定领域内的所有智能外包出去。Netflix的产品推荐或Spotify的每周发现就是常见的例子。自动驾驶汽车或无人驾驶飞机更是这种闭环决策循环的物理表现。
我们允许算法完成这项工作,并向用户提供最终的输出(有时会解释为什么人工智能选择了该选项,而其他时候则完全不透明)。
数据的交互
到目前为止,我们已经讨论了功能数据产品的类型。
这些数据产品中的每一种都可以以各种方式呈现给我们的用户,对他们的设计有明确的影响。这些接口或交互是什么?
API。对于API,我们假设一个技术用户。我们仍然应该遵循良好的产品实践,并确保API的使用直观,有良好的文档记录,能够满足用户的需求,并且值得我们使用。
仪表盘和可视化。对于仪表盘和可视化,我们假设在处理数字方面具有一定的统计知识或能力。在最极端的情况下,我们可以为用户做很多繁重的工作,并努力确保我们只以易于理解的格式呈现最相关的信息。通过选择要显示的信息,我们正在影响决策,但它仍然将解释和决策留在用户的手中(或头脑中)。
网络元素。在过去5年左右的时间里,用户最不常见的数据产品的技术接口就是网络元素。最近,这些接口的应用被广泛扩展,包括语音、机器人和增强现实等。虽然这些新接口的设计细节都是明显不同的,但其中有相当大的重叠,因为它们都围绕着向用户展示决策结果,也许还传达了人工智能实现决策的原因或方式。
了解我们正在建设什么
根据可能的接口绘制数据产品的类型,我们得到一个橙色点矩阵,每个点代表不同数据产品矩阵-不同的产品需要不同的方法。
数据产品矩阵——不同的产品需要不同的方法
矩阵中的每一个元素都要求设计注意事项,无论是在用户需要什么方面,还是在我们用于实现目标的设计过程方面,都会有很大的不同。
从左上角的圆圈(原始数据API)斜向右下角的圆圈(自动决策Web元素)是指从技术、工程驱动的产品转向更典型的软件产品(即产品经理和设计师更直观的产品,往往出现在书中的产品、杂志和文章)。
困难&方法
根据我的经验,当团队将人性化设计方法应用于更多的数据产品时,他们就会遇到大问题。当然,这并不是说工程师不是人。大多数是,而那些不经常有一个不可思议的相似性。但是,HCD是一种整体的产品开发方法,当设计师理解用户的动机和行为时,它是一种很好的方法。对于技术数据产品,产品边界通常被功能组织考虑人为地限制,并且产品和用户体验团队通常不具备以下技术:a)了解技术用户行为的复杂性;b)不具备探索这些复杂性的能力。
那么,假设我们一直在阅读的开箱即用设计思想或精益方法论是幼稚的。
然而,这并不是恐慌的原因。
尽管用户研究的输出可能与面向消费者的产品或真正典型的SaaS产品有很大的不同,而且关键绩效指标的定义可能在技术方面出错,但设计思维和精益都具有足够的可塑性,使我们能够针对这个新领域调整我们的方法。
我的建议是,在将这些方法应用于数据产品时,要确保问题空间是根据最终用户而不是直接数据输出的用户来定义的。很可能,这就意味着要扩大团队,将相邻的产品及其经理包括在内。
同样,如果用户是一个技术性的用户,那么我们就应该适应这种环境。要同情遇到工程问题的用户,可能意味着我们必须打开一个IDE并进行编码。
豆瓣菜,使用HCD瘦肉组合开发。由马库斯·斯皮斯克拍摄
这篇文章形成了我在2017年都柏林的产品罐会议上发表的一个演讲的一些内容。
本文为 AI 研习社编译的技术博客,原标题 :《Designing Data Products》
作者: Simon O’Regan
翻译:YuYuko
校对:吕鑫灿
审核:邓普斯·杰弗