抽象性

高品质移动视频服务需求剧增,新网络技术开发不减,包括雾计算,因此需要通用质量用户经验模型,为各种网络优化设计提供洞察力好QE对投资者和广告商来说是一个重要的优化目标因此,许多作品侧重于理解各种因素,特别是服务质量因素、影响用户参与用户兴趣差异通常被忽视或分解QOS和/或其它客观因素随着个人化应用趋势增加,在优化用户参与时,既有必要也可行考虑用户兴趣满足用户美学和个人需求我们先建议采掘推理算法从易获取用户行为估计用户兴趣基础经验分析 大规模数据集QOS和用户兴趣兼容回归模型.通过对数据集的实验,我们证明拟议模型比基准模型精度提高9.99%,基准模型只考虑QOS因子所拟模型有可能设计面向QoE的各种网络场景调度策略,特别是在雾计算方面

开工导 言

20年来,在线视频应用在PCs和移动设备上增长并受欢迎,趋势正从基本视频提供转向提高行业和学术界用户经验质量一号..视频流服务传统平均评分现代之以用户参与更直接地影响网络生态系统利害相关方投资回报2,3..

高容量视频流传反馈和低带宽输出数据服务可扩展性[实时处理和反馈雾计算4..

作为优化用户接触的第一步,迫切需要通用接触模型,为不同网络环境提供洞察力,特别是最新雾计算环境关于理解和建模参与前题研究数例中服务质量和某些客观上下文因子,如位置、装置和时间属性均被视为与接触相关的基本因子用户接触关系和Qos系统关系,或应用级关系(例如,延迟启动缓冲FrequeNCY和比特率或网络层次上(例如整段信号强度相关作品中广泛探索

多数相关作品忽略了另一个重要因素主体人因素,例如用户个人化对专用视频的兴趣新的定制时代提高用户美学和个人需求,特别是在移动视频服务中,用户通常提供可预测的特征和服务需求[5..用户参与反映程序或服务用户的欢乐或烦恼程度6................. 无法满足仅仅高质量交付缓冲频率相同的会议有时因用户对视频内容兴趣的不同而有不同的用户参与多数前题忽略或排除主观因素的影响,因为它们难以量化。部分作品视视频受欢迎为QoE模型中主观人因子2,7,8视频受欢迎度只能粗略描述用户平均偏好,少数功用九九-11上层从心理学和认知学角度评价人文主观因素在这些作品中,主体因子通过广泛的实验和调查获取,主体群多然而,这种实验和测量费用昂贵,不适合VoD系统流应用

双基接战模式高斯用户兴趣这不仅对准确理解和预测用户参与是必要的,而且对优化系统资源分配和提供更个性化服务都有好处。一方面,发现主观因素如何影响用户参与可帮助设计者部署适当的带宽资源优化用户参与推理系统(RS)可以取舍QOS因素和人因素,向用户推荐他们感兴趣的视频并拥有良好QOS并最后能享受更长时间的视频因此,关键是要理解接触和人因素之间的关系以及QOS,以便说明如何最优分配资源和定制服务

建模前的挑战是如何量化用户对视频兴趣程度前推荐者系统测量用户兴趣或为用户研究显性评分或大致隐式评分,如用户参与原测量法精度高,但在时间敏感应用中无法收集后一则不准确,因为用户参与有时不是对视频纯兴趣的反应,而是受其他因素影响,例如质量问题如质量问题启动延迟.

另一项挑战是如何描述用户接触与统一模型中两个因素之间的关系,为实用应用提供洞察力自然而然,这两个因素影响用户参与,但不是独立参与,这超出了线性回归模型的范围。用户兴趣不仅影响用户参与本身,还影响用户对QOS问题的耐用性机器学习算法,例如决策树和 Naive贝叶斯2,12,可以描述这种依存关系,但不使用简洁公式,因此无法为实用应用提供清晰的洞察力

本文致力于应对这两项挑战我们建议采掘推理算法从易获取用户行为估计用户兴趣通过测量现实世界VoD系统, 我们分析用户接触关系 与QOS和用户兴趣基于对大规模数据集的经验分析,我们搭建Q类s用户nterest基础E级句法高山市QI-E回归模型.实证评价显示,人因素集成比基准模型预测精度提高9.99%,基准模型仅基于QOS因子最后,我们讨论拟议模型应用潜力和未来工作

2.1.MOS对接战度量

用户参与代之以平均评分在流应用中被广泛使用为QoE度量ITU-T建议中标准度量MOS从1到5(即差到优)数值通过用户研究或调查获取13..网络服务、电子商务、多媒体等有影响因素方面有许多分析7,13,14..但由于调查或用户学习费用昂贵耗时,不重复性,MOS无法直接用于视频流应用13特别是雾计算环境需要实时响应(实时感知和数据处理)5..受这些限制驱动开发客观度量,例如用户参与量化用户行为对QE水平的反应视频应用中用户使用量通常用句长度计量8,15放弃率12,15访问数2或跳速率12..用户行为度量器更直接地与增加广告和上市机会相关,从而增加收入8..

2.2.Qos参数

Qos参数常被研究为与QoE相关的首要因素,因为它们至少可部分受平台控制九九..具体的QOS度量法因域不同而异7包括应用级测量法,例如启动延迟、缓冲频率、缓冲比和比特率2,8,16并包括网络级测量数据,例如流流流流量、流流持续时间、交接率和信号强度12,15..因网络条件不确定,QOS应用级度量测用户比网络级用户更接近感知质量

Qos衡量标准有时相互竞争或冲突并需要权衡系统设计例前工作17,18号点出初始时间和缓冲事件之间的竞争关系此外,比特率和缓冲事件之间的取舍常用比特率适配制学习17..

还有一些技术建议调整客户端、服务器或网络中的QOS参数19号..技术包括比特率适配20码预取性21号,22号运输协议选择14并缓存部署23号..

2.3流利因素

最近人们认识到,单靠QOS因素无法确定用户满意度和其他潜在“分解性”因素需要探索7..考虑因素可分类为连通性和时间效应等上下文信息2内容属性如类型和受欢迎度2用户属性如位置24码、装置和性别8..

用户兴趣常被忽视少数作品处理人的因素(类似于本文件中定义用户兴趣的实质)九九,10从心理学和认知学角度和一些人试图综合各种因素,包括人11,25码..然而,进行这种工作费用昂贵,需要较长时间和技师和心理师都参与[九九..识别适合实时流应用的人类主观因素仍是一个未解决问题

理解人因素(例如用户兴趣)对系统设计的影响26利用个人兴趣优化CDN存储资源分配然而,本研究不考虑质量因素,因此无法帮助权衡用户兴趣和Qos

2.4.预测用户兴趣

预测用户对特定项目的兴趣是个性化推荐系统处理的目标问题,这是过去十年信息超载面前热题27号,28码..协同滤波算法,如K-Nearest邻里bor、Bayesian信网和矩阵分解27号,29-34号..CF算法不需要项目内容数据,可适用于难以获取项目(即视频)清晰内容描述的视频系统

此外,正在研究如何获取用户兴趣并量化35码..多数作品向用户索取清晰评分后购买项目、监控视频或浏览网站这种方法精准,但在时间敏感应用中不切实际,如在线VoD系统取而代之的是用户行为,如花在网页上的时间滚动和点击网页36号,37号时间花在视频上38号,三十九和购买过去40码中隐式评分用户行为有时能像[证明41号,但在VoD系统中,它们仍然相当吵 [42号..用户行为不仅取决于用户兴趣, 也取决于监听时间的QoS据我们所知,现有VoD推荐系统尚未考虑隐式评分噪声问题

3级问题定义

本节定义问题范围,然后提供目标模型所考虑因素的度量定义

3.1.问题声明

本文的主要目的是基于客观QOS因素和VoD系统主观个体兴趣因素提出实用接触模式清晰性方面,我们省略视频类型、设备类型和时间属性等其他混淆因素的影响

因此,目标是建模表示 去哪儿 表示用户兴趣水平、用户参与度和值kThthQOS测试使用器使模型清晰实用函数依赖函数 表格应清晰简洁

3.2度量定义

本节定义模型中各种因素的度量为了澄清定义,我们先介绍逐页查看的术语一号.

典型取景片段启动时用户启动请求并结束时他/她完成对内容或修改对另一个或关闭客户代理一开始,多数用户可能经历一段广告期,有时甚至延迟启动浏览期间用户可能因网络拥塞或速度限制而受冻结延迟影响用户还可以触发暂停或将进程栏拖到新位置用户拖到新位置时内容尚未预取值,heshe可能经历重开延迟

按照观光会议定义,我们现在定义三大因素的度量

3.2.1参战度量

用户接触定义有效监视比本文衡量视频实际播放量以回放时间对视频长度之比计算重播时间指会议时间排除启动延迟、重新启动延迟、缓冲缓冲、暂停和广告时间广度作用值受限 0%到120%

3.2.2.2度量聚合

论文中,我们考虑应用级QOS测量量 捕捉交付对客户端的影响具体地说,我们注重以下度量

启动延迟.即视频开始播放时间和用户请求后立即启动时间,不包括广告时间分秒测量

缓冲频.即缓冲事件数与缓冲和游戏总时间之比以分钟数计量

缓冲比.即会话中缓冲或恢复缓冲所花时间与缓冲和游戏总时间之比测量百分比

扩展研究2.....平均缓冲长度.

平均缓冲长度.平均时间缓冲事件发生计算之比缓冲比切入点缓冲频率.新度量建议补充缓冲频率

我们不区分缓冲和重开缓冲事件,不讨论另一种常用质量度量比特率数据缺失省略并不会削弱我们研究的价值, 因为问题不在于研究质量度量之间的关系, 在于解决质量和用户兴趣之间的竞相或冲突关系必要时或数据提供后,模型可扩展

与网络级QOS度量器相比,应用级度量器在多网络环境中可更广泛地应用他们可以通过相关技术管理应用级QOS度量法,如内容传输网络服务选择2P2P网络预推法43号,44号和缓存技术雾计算4,45码,46号并优化用户接触 基于应用级QOS矩阵 插入QoE模型

3.2.3用户兴趣度量

用户兴趣是用户对特定视频内容的主观感知和好奇心我们视用户兴趣为1至10的非维参数本文前文讨论过,很难要求用户明确评分并直接使用用户行为测算的隐式评分可能导致不准确性因此,我们建议推理算法获取用户兴趣,将在C节中描述4.

3cm3数据集

建数据驱动模型时,从PPTV客户端收集大规模数据集47典型商业P2P流水系统匿名用户日志从3月23日到3月28日不等,日志记录所有行为相关质量信息

过滤其他混淆因素(例如设备、时间属性和视频类型)的影响时,我们只考虑从客户端收集会议时间,时间为7点中午12时并关联视频类型 在我们分析但此处建议的方法并不限于这些上下文,可扩展至其他上下文,例如移动设备或其他视频类型

4级用户兴趣推理

本节通过分析数据集,我们首先显示用户接触不仅受用户兴趣影响,还受Qos表示调试时间到用户兴趣水平不准确然后开发E级减法-推理器E-I)利息估计算法并用数据集评价

4.1.测量分析

使用/不缓冲事件或启动延迟比较用户参与会议分布缓冲会议/平滑会议)

表示图中的块2显示有重大空白点,显示单方委托无法准确描述用户兴趣,用户委托也受质量问题影响显示缓冲事件令全范围约定分布更加均衡多数用户不经历缓冲事件, 或完成全视频观察(占会议量的32%)或远早放弃会话,反之,在缓冲会话中,这两个极端案例加在一起占22%以下

图中分布空白2归结为质量问题,一方面损及用户观察经验并减低长时间概率,另一方面显示用户对视频仍然有一定兴趣,而不是甚至在缓冲事件前一开始就放弃会话

4.2采掘推理算法

我们建议启发式E级减法和推理器E-I)利息估计算法基于以下两个假设:(1) 从Qoss和寻址状态看,用户订婚时间仅取决于她对视频的兴趣水平;(2)用户偏爱短期内保持一致性,建议系统广泛接受算法分两步开发一号.

步骤一解析式解析提取用户兴趣 从他们的订婚记录平滑性会话
用户不经历质量问题,包括缓冲事件或启动延迟
步骤二推理推理基于提取兴趣记录 步骤I推算用户兴趣

第一,在选择会话中,Qoss和寻道状态确定即QOS度量值和求态等值为0正因如此,这些课程的订入时间由用户兴趣决定。用户平滑会议分布为10箱时均指用户兴趣隐式评分(即1表示差和10表示优)。

基于收集用户对选定会议的兴趣,我们下一步使用矩阵分解法三十三,34号典型协同滤波算法35码-38号推断他们对其他会议的兴趣对比其他一些典型CF算法,例如KNN算法35码,36号MF算法比较能处理数据悬浮36号和,在我们实验中, 数据使用培训相当稀疏所选课程(既用于培训也用于测试)只占数据集中课程的23%

MF算法假设用户兴趣可以通过描述用户和视频为联合潜值空间来解释在此空间内,用户和视频应表示为M维潜值矢量用户u提供向量 视频V's向量 ,她对这段视频的兴趣 可预测为除全球平均兴趣外二矢量的产物 ,用户偏差 ,和视频偏差 .也就是说 .实践中潜因子向量 ,和偏向者, ,由随机梯度下降算法学习14循环训练数据集以最小化实用函数即 .来 表示一套历史兴趣记录

4.3评价

平滑课程利用数据培训评价十倍交叉验证 修复参数 和M,E-I算法中 分别为0.05和30

比较时,我们建议两种基准方法第一类(即基准I)修改E-I算法步骤I直接映射用户参与所有会议的兴趣(不管质量问题如何)。第二类(即基准二)替换推理算法MF算法,代之以表定义的一些统计法和另一种CF算法K-NET邻里bors一号.

我们评价接战预测精度(根平方错误测量)三十九)算法测试数据集中 选择式解析 并使用记录代表用户纯兴趣

表表显示结果2E-I算法提高接战预测精度18%bilitI上,27%gune上,7.26%Uavg上,8.9%Iavg上,6.3%UIavg上,4.8%KNN上我们提议的E-I算法的积极结果确认,当用户从录用记录中提取兴趣时,有必要消除其他相关因素的影响

5级作用预测模型

取用预测模型

5.1.用户互动对QOS度量
5.1.1.QOS分发

我们先看数值分布 各种QOS度量图中显示3发现系统总体质量良好,尽管质量问题在某些类会议中并非无关紧要数据集中43.5%的片段没有经历质量问题具体说来,70%的会话没有经历缓冲事件,50%没有经历启动延迟.但仍有一些课程忍受相当差质状况举例说,5%的会话受缓冲率超过10%5%会议百秒播放时间超过5次缓冲事件

总体良好质量限制传统接触模式使用范围,仅考虑Qos这些模型无法辨别会议质量问题,尽管如前文所示,QOS计量值应作为相关因素加以考虑。

5.1.2.关联分析

下一步,我们研究用户参与期望条件 各种质量度量给质量值 条件期望用户使用计算 中位 条件概率 区域作用值范围定义3.2.

图中显示条件期望图4.支配范围缓冲频率图中显示[0,18%]3(b)举个例子,参保通常会逐行下降,因为质量比预期差,如图所示4(b)表示下降速率以较大的缓冲频率减慢效果支持直觉 用户对质量下降情况不敏感 一旦他们受苦用户接触和缓冲比关系显示相似特征均缓冲长度或启动延迟较大,如图中显示4(d)4(c)用户接战并不如平滑 表示用户接战与这两个度量关系弱

此外,我们量化相关系数对数运算QOS值并有条件期望参战宽减对数运算符中的0值,所有QOS值增加1即 中位 原创Qos值 算法型我们使用相关度量皮尔逊相关系数t36号spearman排名系数三十九..第一种度量可识别与高斯噪声的线性关系,而第二种则强调变量间的单调性表显示3测试结果确认,在所有QOS度量器中,缓冲频率和重新激活缓冲比显示最强日志-线性关联点与接战关系,这意味着对接触预测模型中的这两个度量值最大应分配

5.2用户互动对用户兴趣

我们现在研究用户接触和用户兴趣之间的关系图中显示5(a)用户使用量直线增加,兴趣水平提高,但头部除外(头部除外)( )和尾 中文本不适用幸运的是,头尾范围只占会议0.9%。线性特征仍然支配关系

此外,用户接触和用户兴趣相关系数强于表中所列大多数QOS度量一号.结果确认个人兴趣约线性依赖订约

5.3用户对QOS对用户兴趣

直觉上讲,QOS度量和用户兴趣可能不独立地影响用户参与用户对视频兴趣程度不同时对质量问题可能有不同容忍度

验证直觉时,我们在强利水平下比较参保-QOS关系,而在微利水平下则分别比较参保-QOS关系,如图所示5(b).缓冲频率例子统计中,我们将缓冲频率对数分到10桶并表示binne缓冲频率分到0至10分区间定为1分统计

强利和弱利分界定在所有用户利益分量的中位数

显示当用户对视频更感兴趣时 接战比缓冲频率增加更快下降换句话说,兴趣强的用户往往对质量问题更加敏感。这两例之间的重大差分显示用户兴趣和QOS对用户接触的多重效果的存在

6级建模评价

6.1.互动模式

根据以上测量结果,我们建议Q类s用户nterest基础E级句法QI-E回归模型使用此模型用户 带利息评分 带视频 ,我们预测himher订婚 视频制作 去哪儿 Qos矢量元素 算法值 THQS度量即 中位 原创Qos值所有QOS度量与向量相关 接二连三 . 权值参数通过实验学习

基于此模型 期望用户参与 ThsQos矩阵对数值 可导出 去哪儿 期望用户兴趣评分 算法值 TthQOS度量但非 首选两者均常量清晰度参数 引文中省略 。

发件人3表示有条件期望用户参与 线性比例对数QOS值 ,与段测量结果一致5.1.并增加利息评分 ,有更大的斜坡 线性关系中与段测量结果一致5.3.类似地,用户使用偏差以利息评分为条件 很容易显示模型与段测量结果一致5.2.

6.2模型评价

随机选择全数据集80%用于培训,其余测试通过十倍交叉验证,我们修复参数 QI-E模型

比较时,我们建议三组线性回归模型为基线第一组用BS-1表示,模型分别考虑单量子系统度量以BS-2表示的第二个基线模型中,我们计及所有QOS度量数,而以BS-3表示的第三个度量值则额外考虑用户兴趣

表内4(a),我们先评价第一批基线模型其中包括模型考虑缓冲频率最小RMSE31553和预期值一样,该度量拥有最大关联系数并按表显示参与3.

表内4QI-E模型比较考虑所有QOS度量模型显示结果显示,当考虑用户兴趣时,提高3.5%QI-E模型考虑两种因素的倍增效果时,改善率上升至7.6%。

积极结果确认我们拟参与预测模型的有效性并证明理解QOS因素和用户兴趣对用户作用的必要性实验用个人电脑客户程序数据集进行,但我们的方法和结果很容易扩展至移动客户上下文

7摘要和讨论

7.1摘要

本文显示,为优化用户直接参与VOD流水系统,需要一种有效互动模式,将用户兴趣和感知质量因素都纳入显性函数中为此,我们建议采掘推理算法从易得用户行为估计用户兴趣并基于大规模数据集实验分析搭建QOS和用户兴趣连接回归模型模型精度比基准模型提高9.99%,仅考虑QOS因子积极结果显示用户兴趣和Qos

7.2.讨论意义

关于理解和建模用户接触的研究可应用到大多数最新网络环境,包括雾计算举例说,它可帮助设计师通过不同用户兴趣取舍QOS因子CDN选择流决策之类48号,49号..

特别是在雾计算方面,提供全博局部用户特征和服务需求,用户对这个案例的兴趣更可预测,用户个化需求可更好地满足4,46号..面向全局优化目标 以模型为基础 设计师可以向用户提供更高兴趣 优先带宽优化举个例子,在面向互动推荐系统中,设计师可以权衡视频,满足用户兴趣并提供更好的QOS

未来,我们将进一步扩大模型以考虑更多因素举例说,像拖动等用户行为可帮助理解用户的耐性此外,我们可以设计调度程序 专为雾计算上下文

数据可用性

数据集由商业企业PPTV支持数据不公开

利益冲突

作者声明他们没有利益冲突

感知感知

这项工作部分得到中国国家科学基金会Grant nos支持61572071,61271199和61301082