基于乘客需求的站务管理平台系统设计研究

智能计算   作者:张 宸,祁海涛(北京市地铁运营有限公司运营一分公司,北京 102209) 时间:2021-02-24来源:电子产品世界

编者按:对于地铁站务管理平台系统的设计和开发,由于站务工作者直接服务于乘客,其工作安排都与乘客需求息息相关,所以除了考虑站务工作者本身的需求外,在进行站务管理平台系统设计时,还应充分考虑乘客的实际服务需求。本文通过主题模型方法分析乘客热线的内容文本,深入挖掘乘客在地铁站乘车时的服务需求,并进一步推导出地铁站务人员的工作需要和站务管理平台系统的功能需求。功能验证表明,通过乘客需求挖掘设计和开发出来的站务管理平台系统,才能更加贴近站务工作者的实际需要,更好地为乘客提供乘车服务。


0   引言

站务管理平台的设计与开发离不开对乘客需求的分析和挖掘,北京地铁热线是北京地铁与乘客之间的重要沟通渠道,每年都会积累大量乘客留言信息,这些信息往往会暴露出运营过程中存在的不足,并可进一步发掘出乘客的潜在服务需求。因此,对于乘客需求的挖掘,将有助于精确地定位站务管理平台系统的功能,使系统更加符合乘客的实际需要。

从现有文献可知,对于乘客的需求挖掘方法,通常采取乘客调研的方式——请乘客填写调研问卷或进行访谈,这种方法的优点是获取的信息较为全面,缺点是需求挖掘不够深入,并且由于调研问题的限制,一些需求点容易被忽略。通过乘客建议文本挖掘乘客需求是对乘客调研的补充和替代,乘客主动提出的建议能够反映出乘客真实可靠的需求。

1   乘客需求挖掘关键技术

本文通过主题模型方法对乘客需求进行挖掘。首先,将乘客建议文本由非结构化数据通过文本预处理方法转变为结构化的数据,并去除掉停用词及干扰词,生成分析语料;其次,将语料导入到主题模型当中,生成主题分类结果及主题关键词;最后,通过领域经验根据关键词生成最终分类结果。

1.1 LDA模型

LDA(Latent Dirichlet Allocation)主题模型由David M Blei提出,属于自然语言处理中主题挖掘的典型模型,是基于概率图的三层贝叶斯概率生成模型。LDA主题模型的主要思想是假设文档集中的每个文档均由多个主题混合而成,每个主题是固定词表上多个词汇的多项式分布,目的在于采用高效的概率推断算法处理大规模数据,从文本语料库中抽取潜在的主题,提供一种量化研究主题的方法。该方法目前已经被广泛应用到各类主题发现中,如热点挖掘、主题演化、趋势预测等。

LDA模型认为文档是由权重相同的词语可以用矩阵分解的形式表现出来,通过矩阵分解可以构造出LDA的概率模型。也就说LDA模型可以通过图1左边的矩阵进行训练,学习得出右边2个矩阵。

image.png

图1 LDA模型的矩阵形式

在向量空间中,任何语料(文档的集合)可以表示为文档(Document - Term,DT)矩阵。表1的矩阵表达了1个语料库的组成:

表1 语料矩阵


W1

W2

Wn

D1

0

2

3

D2

1

4

0


Dn

1

1

0

其中,N个文档D1,D2,…Dn的组成语料库,M个词W1,W2,…Wm组成词汇表。矩阵中的值表示了词Wj在文档Di中出现的频率,同2时,LDA将这个矩阵转换为2个低维度的矩阵:M1和M。

表2显示了M1矩阵的情况,它是N×K大小的 document-topic 矩阵,N指文档的数量,K指主题的数量,M1中,是一个长度为k的向量,用于描述当前文档在k个主题上的分布情况,Z表示具体的主题。

表2 语料矩阵


Z1

Z2

Zn

0

2

3

1

4

0


1

1

0

表3显示了M2矩阵的情况,它是K×V维的topic-term矩阵,K指主题的数量,V指词汇表的大小。M2中每一行都是1个分布,也就是主题在m个词上的多项式分布情况,可以通过学习得到。

表3 语料矩阵


W1

W2

Wn

0

2

3

1

4

0


1

1

0

1.2 LDA建模流程

基于LDA的文本主题建模包括文本数据导入、建立语料词典、形成词袋模型和词频数据类型、设置主题建模参数,主题建模流程见图2。

image.png

图2 LDA主题建模流程

1.3 乘客建议文本预处理

本文共收集了2018年北京地铁乘客热线留言5 000 条,在进行乘客需求挖掘之前,先对原始文本数据进行预处理,将文本的半结构化数据转变为结构化数据。需要对原始文本数据进行去重、分词和和过滤停用词处理。

1)原始文本数据去重

由于乘客建议文本数据存在着重复记录的问题,对于后续的文本分析会造成一定的干扰,所以需要对原始数据进行去重操作。

2)文本分词

分词阶段就是对每个文本进行中文分词,词性标注,并且使其结果按照规定的格式输出。本研究采用Jieba分词算法,分词精度高,其中基于角色标注的新词识别的召回率高于90%,词性标注、分词处理速度达到543.5 kB/s。

(3)过滤停用词

因为在分词阶段所得到的词集中,有很多词是无实际意义的,这些无实际意义的词对分析工作的影响可以忽略不计,但如果将这些无实际意义的词作为文本特征词,往往会给文本分类结果带来较大的误差,通常本文将这些词称为停用词。所以就需要在正式的文本分析前,对这些停用词进行过滤。

1.4 语料主题建模结果

主题建模结果包含了多个主题,主题数量由参数设置决定。每个主题又包含了多个主题词和主题词的权重,权重代表主题词属于该主题的概率。根据关键词参数的设置,结果按照权重的大小排序,筛选出该主题下可能的主题词。总结出乘客需求挖掘的主题类型如表4所示。

表4 乘客需求主题类型及关键词

主题类型

主题名称

特征词

Topic 1

标志标识

标识、线路图、提示、附图、信息

Topic 2

乘车安全

乞讨、车门、摔倒、夹到、卖艺、治理

Topic 3

站车服务

态度、吸烟、嬉笑打闹、手机

Topic 4

客运组织

进展、安检、限流、高峰、盲道、刷卡、候车、围栏、排队、换乘、拥堵

Topic 5

温控噪音

温度、通风、空调、闷热、冷气、暖风

Topic 6

设施设备

漏水、电梯、扶梯、维修、检修、闸机、故障

Topic 7

运营时间

间隔时间、发车、缩短、晚点、首班车

Topic 8

站车卫生

异味、保洁员、很脏、通风口、漏水、油污、卫生间

根据乘客热线留言的主题模型挖掘,分析出乘客的乘车的需求包括:

1)具有方便乘车并快速准时到达目的地的需求,如导向标识清晰、列车时刻表准确等,包括Topic 1、Topic 4和Topic 7。

2)具有乘车全流程中保证人身安全的需求,如设备运行稳定、人员安全等,包括Topic 2、Topic 6

3)具有在乘车的全流程中保持舒适的需求,如地铁工作的人员的服务态度良好、服务技能达标、环境适宜等,包括Topic 3、Topic 5和Topic 8。

2 基于乘客需求的站务管理平台系统设计

根据乘客的上述需求,站务管理要从乘客的基本乘车需求、安全需求、服务需求三方面出发,进行相应工作安排。对于站务管理平台系统设计也应从这三方面着手,配合站务管理工作。因此,对于站务工作人员提出了如下的工作需求:

1)始终保持对车站的整体态势的持续感知功能,对车站运行状态的全面掌握,对突发时间的及时响应,需要囊括的数据包括车站的环境信息、客流量信息、列车到站时间和站内设备运行状态等;

2)对于站内的各个系统设备进行巡检、管理维护,及时对设备故障进行维修,并完善设备维护和故障维修记录;

3)对站务工作人员持续地进行业务培训,保持工作人员良好的服务态度,不断提升业务技能;

4)合理的进行工作计划安排,保持车站业务运行顺畅,提高站务人员的工作效率;

5)对乘客提出的问题要记录和汇总,并及时做出改进和反馈;

6)对车站的物资的合理化管理、运用和分配。

针对上述站务工作人员的业务需求,提出了相应的站务管理平台系统框架,如图3所示。

image.png

图3 站务管理平台系统架构

1)感知层

基于对于地铁站内的态势感知需求,需要不同的传感器获取站内设备的数据,了解设备的运行状态;不同的系统接口,获取票务、电力、环控等系统的数据进行综合分析;统一的通讯协议,在不同系统之间传递数据和指令,使地铁站内不同的系统结合程有机的整体,协调发挥作用。

2)业务层

根据站务工作的需要,结合感知层获得的数据,构建工作管理、巡检管理、设备故障报修、员工培训、数据管理和台账管理六大功能。通过这六个业务管理模块,协助站务人员完成业务需求。

3)终端设备层

站务管理平台系统实现了台式机、平板电脑和手机的跨平台建设,打破传统管理信息系统桌面端的限制,实现桌面端和移动端数据的共享,赋予站务人员移动办公能力,提高业务处理效率。

4)用户层

站务管理平台系统主要使用者包括站务领导、站务工作人员和系统管理员。系统管理员负责维护系统保持系统的正常运行;站务领导主要通过系统进行工作安排,并通过系统数据掌握站务工作进展;站务工作人员通过系统接收各种工作任务,并通过系统将工作中的产生的数据反馈到系统中来。三类用户根据岗位职责不同,拥有不同的系统权限。

3   结语

区别与传统的信息系统需求设计,本文并非单纯挖掘系统使用者的业务需求,而是进一步分析系统使用者的服务对象,从服务对象需求的角度推演出系统使用者的需求,使系统设计更加符合实际需要。本文利用主题模型方法,对地铁乘客热线的留言文本进行分析,挖掘出8种乘客乘车常见的问题,汇总出乘客准时到达目的地、安全和舒适的3种需求,并推演出站务工作者对地铁站态势感知的需求,对自身业务技能和服务态度提升的需求,对于地铁站设备故障及时维修的需求,对工作计划科学合理安排的需求,对乘客问题及时改进和反馈的需求,和对车站物资合理管理的需求,并根据以上需求设计出适合地铁站务工作的管理信息系统。

参考文献:

[1] 郑大威,马琳,燕飞.地铁设备智能维修管理研究及展望[J].都市快轨交通, 2018 (5): 32.

[2] 肖雄,陈朝晖,何华强.智慧地铁车站移动站务管理系统的设计与研究[J].通讯世界,2020(1):25.

[3] 谢美丽,张欣环,吴金洪,等.基于模糊综合评价法的杭州地铁乘客满意度评价[J].交通与运输,2020,36(02):78-81.

[4] 刘建荣,周毅镕,祝旭乾.基于Rasch模型的地铁服务质量研究[J].武汉理工大学学报(交通科学与工程版),2019,43(04):580-584.

[5] 黄体允,夏妞,李秋健,等.基于乘客出行满意度的地铁换乘方案优化[J].价值工程,2020,39(08):27-28.

[6] 吴刚勇,张千斌,吴恒超,等.基于自然语言处理技术的电力客户投诉工单文本挖掘分析[J].电力大数据,2018,21(10):68-73.

[7] 刘兴平,章晓明,沈然,等.电力企业投诉工单文本挖掘模型[J].电力需求侧管理,2016,18(2):57-60.

[8] 廉素洁.基于文本分类和情感评分的电信投诉文本挖掘研究[D].杭州:浙江工商大学,2018.     

(本文来源于《电子产品世界》杂志社2020年12月期)

关键词: 乘客需求 主题模型 乘客热线 文本 站务管理平台系统

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版