基于信息组织的淘宝平台商家数据化运营与优化策略案例分析
赵 晓 张玉洁 向 前 白 磊
云南大学历史与档案学院
电子商务数据是企业进行电子商务活动时产生的行为数据和商业数据,反映了电子商务在运行的过程中所产生的各种活动及客户情况。电子商务数据能够帮助企业了解整个市场发展的相关数据,认识到企业自身竞争力情况的数据。企业在经营过程中积累大量的数据,对这些数据进行分析,能够更精准、更科学地辅助企业发展。本文将以淘宝平台及女装 TD店铺为例进行电商数据分析的论述。
一、案例背景
淘宝平台是亚太地区较大的网络零售平台,尤其在中国深受喜爱,有5 亿的注册用户,日活跃用户超 1.2 亿,同时淘宝网还拥有超过 10 亿件的在线商品数,创造了许多的就业机会。如今淘宝网已经成为在全世界通用的电子商务交易平台之一。

二、案例正文
(一)基础理论
1.检索语言
一种由表达信息资源主题概念及其相互关系的词汇及规则组成的人工语言系统,也称情报检索语言。
2.知识组织系统:知识组织系统指经过组织的知识结构表达的工具,包含组织信息和促进知识管理的各种类型的词表,其范围从传统的地名表、同义表,到新型的知识组织工具。
3.信息处理的基本做法:(1)描述信息资源。以便识别与确认它,主要方法是著录、编写题录和资源形式特征的描述;(2)浓缩信息资源内容。主要方法是编写内容提要或文摘,供用户了解、选择和判断信息资源;(3)提供检索点。主要方法是确定特定资源的标索特征(或标识)与可检信息。
信息资源的检索点有代表其内容特征和形式特征的各种标识,如题名、责任者、分类号、主题词或关键词等。
4.信息组织活动的内容:(1)信息组织的操作。指根据信息资源的内容和特征,对信息资源进行描述、标引、并将其组织进相应系统的过程;(2)信息资源的组织规范。这是根据信息组织的需要,按照信息资源的特点预先确定的规则和方法系统。
(二)分析淘宝的分类组织架构
淘宝网包含大量商品信息,采用了分类的组织方式、其商品类目如图2 所示。在该类目中,第一级包含 43 个大类:虚拟、服装、鞋包配饰、运动户外、珠宝手表、数码、家电、美容护发、母婴用品、家居建材、美食特产、日用百货、汽车和车品、文化完玩乐、本地生活等。而每一级类目下,又包含多个二级类目。从类目深度上可以达四级。

在分类方法上,对商品的分类主要采用了按照商品事物特征分类的方法,从用户角度根据商品特征的相似性,将各个商品进行归类。
商品的二级目录往往采用多个词汇组配的方式,体现该类目的特征,而非采用单一的词汇词组。有时,二级类目的名称标引并不能涵盖该类下的所有商品,但可以将商品中的大部分或较重要的类目加以突出。
除了对商品进行分类组织外,店铺也是淘宝的重要组成部分。在对店铺进行组织时,同样采用了分类方法。由于店铺数目较之于商品的数目大大减少,因此在分类目录的级别上也相应减少。店铺分类包含两级分类目录,其中包含 43 个大类,387 个二级类目。
(三)分析淘宝网的信息标引
淘宝网采用专用的商品词汇对各类实体(商品、店铺)进行标引,标引采用了手工和自动的方式。其中手工是指商品的类目名称、品牌名称需要由商品卖家手工设定,选取商品所属的类目。在指定类目下的商品,店铺主人每添加一个商品记录,都要对商品信息作描述,对于描述的文本内容,淘宝采用自然语言标引的方式进行标引。
淘宝网为商品、店铺和用户进行了建模,除了其所述的类目外,还包括许多其他特征,而不同类别的商品,又有自身的特征。在对“手机”和“服装”进行描述时,将分别根据两者的不同特征进行描述,因此采用的描述方案有很大的区别。
(四)分析淘宝网的搜索引擎
可以对商品、店铺、商城等信息进行检索。在搜索引擎组织方式上,可以分为两类:基于数据库的组织方式和基于网页的组织方式。其中前者主要面向结构化程度较强的商品、店铺对象,淘宝通过对其进行数据库建模,采用数据库的方式加以存储,在进行检索时,则可以根据多个检索点进行检索;而后者则主要用于对论坛等对象进行爬取和索引,是针对非结构化的网页信息进行的组织,因此在检索点的数目上较少。
(五)分析淘宝店铺的信息组织
在淘宝网内,一个个店铺构成了整个销售平台,因此店铺是基础,每个商品都要归属于某个店铺。因此店铺的信息组织成为淘宝网的重要组成部分。此处主要从店铺的组成部分上进行阐述。
淘宝店铺的内容组织包含如下内容:(1)店铺基本信息:包括店铺主人的基本信息、店铺所在地、店铺等级等。(2)商品类目:每个店铺都维护着该店的商品类目,这个类目完全由店铺所有者自己确定,不受整个淘宝商品分类目录的限制。(3)商品信息展示:对店铺的商品进行展示,包括商品的图片、介绍个信息,在展示时可分为多商品浏览和单商品浏览两类,前者对多个商品进行展示,后者对单个商品进行展示。对于后者,还会展示商品购买的评价记录信息。(4)店铺服务:这类内容主要包含店铺的服务承诺、邮购方式、售后服务等信息。(5)相关链接:这一部分主要将店铺与其他相关店铺以链接方式加以练习,使店铺之间形成链接关系。
在实际中,店铺主人往往将自己的其他店铺或朋友的店铺放置到相关连接中。
图 3 淘宝网女装一级类目下的二级类目分类界面

图 4 淘宝网卖方手工信息标记平台

(六)分析淘宝网的索引、排序和展示
淘宝网在进行信息组织时充分利用了各类索引方式。在对商品类目进行组织时,采用了拼音索引,即将商品类目依拼音进行索引归类;除了拼音索引外,还包含品牌索引,根据同类商品的不同品牌进行索引;价格索引,即对商品的不同价格,进行区间划分,并将不同区间的商品进行显示;区域索引,根据店铺所在的不同区域,进行索引,方便用户按地区浏览店铺及商品信息;销量索引,根据所搜索物品的总销售数量进行索引,方便用户根据销量进行选择。
在对商品和店铺信息排列时,淘宝网提供强大的排序方式,可以根据价格、店铺信用对商品进行排序;淘宝网则提供了多种展示方式,对于检索结果的展示,包括列表型和橱窗型展示两种;对于商品信息展示,则主要采用图像的方式展示商品试题,在展示时,往往从不同角度、侧面为商品提供多个图片,并可以缩放显示,这方便用户从多角度及不同细节程度上把握商品信息。
三、案例思考题
1、淘宝网商品信息组织与传统信息组织的比较。
2、网络商品信息组织的建议。
四、阅读文献
[1]胡阿沛.基于人人网的社交网站信息组织研究[J].图书情报工作,2013,57(S2).
[2]姜吉栋,赵辉,刘润达.科学数据共享平台网站中的信息组织——以国家人口与健康科学数据共享平台为例[J].信息资源管理学报,2012,2(04).
五、案例使用说明
(一)适用范围
本案例适用于图书馆学、信息资源管理本科《图书馆学基础》《信息组织》《信息检索》《信息服务与用户研究》《信息资源建设》等课程的辅助案例;亦可供图书情报硕士、图书馆学和情报学硕士研究生的《信息组织》《信息检索》等相关课程参考。
(二)教学目的
本案例旨在通过案例展示与讨论,加强学生对信息资源组织理论的理解,思考在购物网站或电子商务网站的信息资源组织中,面对信息资源体系的完整性和用户需求的多样性之间的矛盾如何取舍的问题。
(三)知识要点
① 覆盖知识点:信息资源建设、信息组织、网站建设等。 ② 能力训练点:掌握。
(四)教学建议
本案例按照 1 学时进行设计。课前要求学生预习到位,需要阅读信息资源建设和信息组织相关的文献,然后再课堂上进行小组讨论、思考和提问。
参考文献
[1]丁亮.基于一体化课堂教学的共享型教学资源管理系统研究与应用[J].信息与电脑(理论版),2024,36(20):109-111.
[2]王锰,古宇,钱婧,等.田野研究在推动信息资源管理专业实践教学创新发展中的应用——以“社群信息学”为例[J].国家图书馆学刊,2024,33(03):68-83.
[3]张烨琼.“双新”背景下空中课堂资源利用的实践与思考——以信息技术学科《人工智能——人脸识别》为例[J].中国多媒体与网络教学学报(下旬刊),2024,(04):48-50.
作者简介:赵晓,女,山东临沂人,云南大学历史与档案学院副研究员,研究方向为中国古代阅读史、图书馆学史、藏书理论与藏书方法及阅读推广等。
张玉洁,女,河南许昌人,云南大学历史与档案学院 2019 级图书情报专业硕士研究生,研究方向为图书馆学、信息行为学。
向前,男,云南曲靖人,云南大学历史与档案学院 2019 级图书情报专业硕士研究生,研究方向为档案学管理。
项目资助:本项目为云南大学教学与改革项目“基于翻转课堂的创新创业类课程教学模式探索研究”成果之一。