摘要:本文分析了国内液化石油气市场的基本情况,分析研究了液化石油气价格可能的影响因素,对于 具有突出特征的区域市场进行了深入分析,以此为基础应用西南地区液化石油气价格数据,进行 了基于大数据的文本挖掘预测方法的应用尝试。通过大规模的文本信息中的石油行业相关关键词 和相近词的收集和整理,结合数值预测方法,建立了一套基于大数据的文本挖掘预测方法,并编 写了相关预测程序。该方法成功应用于液化石油气价格的预测中,程序计算的结果表明在本文数 据引入的情况下价格预测精度取得了进步。
关键字:液化石油气;价格预测;国内市场;大数据;文本挖掘
1 液化石油价格形成机制
液化石油气是一种清洁能源,一般用于民用和商业燃气、工业原料气、车用燃料、炼厂燃料等领域。目前市场上的液化石油气成分主要有丙烷、丁烷、正丁烯、异丁烯等。液化石油气的来源主要有石油炼制、油田气回收、蒸汽裂解制乙烯/丙烯、甲醇制烯烃等,国内主要来源于炼油,从国外进口的基本都是油田气。液化石油气作为一种石化基础原料和清洁燃料,来源不同,成分也不同,利用的途径也不相同。
近年来,随着我国环保政策的改变、市场环境的变化、炼化技术的发展,液化石油气市场发生了诸多变化,同时发展趋势也产生了根本性的改变。
1.1供需情况液化石油气供给方面,国内由于炼厂烷基化装置的逐步上马,液化石油气供给持续减少,而进口气是补充这一供应量缺口的关键。截至2018年进口液化石油气持续增长趋势,但增幅明显放缓,国内深加工领域发展需求增长,但民用领域进一步扩张受限。2019年暂无新增PDH(丙烷脱氢制丙烯)装置投产,现有的PDH装置多已运行平稳。民用市场扩张已达到瓶颈,终端需求增长受限。
2019年中国液化石油气进口来源国排名前5位的分别是阿联酋、卡塔尔、美国、科威特和沙特。2018年来自中东地区货源占比71%,较2017年明显增加,主要受中美贸易战影响,中国进口商采购全面转向中东、非洲、澳大利亚等非美国货源,另有部分进口商与日韩置换非美国货源,9月份之后再无美国液化石油气类产品进入中国,而中东、非洲、澳大利亚、日韩等货源相应增加。2018年来自美国的货源占比由19%降至11%。
我国国内液化石油气主要消费用途是作为民用和商用燃料,其次是工业燃料。近年来,随着技术进步和成本降低推动了美国液化石油气产量大增,而化工方面的需求则推动着我国液化石油气需求稳步增涨,供应和需求上的变化促使液化石油气市场信心得到了提振且加快了发展速度,也逐渐改变着全球及我国液化石油气市场的格局。2018年民用气消费占31%左右,受化工原料加工需求的增加和新能源的替代冲击影响下,比重较往年继续缩减;随着深加工装置的扩建投产,化工原料气需求的加速增加,化工及工业方面的消费总占比已超民用市场,各占45%和14%;餐饮等行业的社会商用量则相对稳定仍占到9%左右;而车用气方面因国家环境保护的重视及其相关政策的制约,以及新能源的持续发展,整体占比仅占1%左右。
1.2价格情况
国际液化石油气价格走势方面,2018年整体价格走势明显背离季节规律,外部因素对于液化石油气市场价格影响更为明显。一方面,国际原油2018年前三季度呈现持续震荡走高态势,推动液化石油气价格快速上行,在淡旺季交接的10月份,涨至年内高位。而自1月份中旬开始,国际原油急转直下,液化石油气同步走跌且幅度不断扩大,截至11月中旬,逼近2017年低位。
2018年国际液化石油气市场的另一个特点是丙丁烷之间的价差发生较大变化(图1),2018年CP价格丁烷平均比丙烷低2.9美元/吨,而2017年丁烷平均比丙烷高34.1美元/吨。丙丁烷之间价差变化的主要原因是下游市场的不同,丁烷主要用于替代乙烯裂解装置的石脑油,丙烷主要用于PDH装置。2018年PDH装置效益明显支撑丙烷需求,石脑油价格低迷抑制丁烷需求。
国内液化石油气价格走势情况方面,2018年液化石油气市场传统烯烃深加工企业正在遭受行业洗牌,消费税、乙醇汽油等非市场因素加快了行业的格局重建。2017年国内液化石油气市场的炼厂整体价格先抑后扬,呈V型走势,而2018年炼厂价格波动较去年更为显。2017年国内液化石油气市场的炼厂整体价格先抑后扬,呈V型走势,而2018年炼厂价格波动较去年更为明显,上半年价格于3月跌至低点后,一路上涨,并于下半年10月中旬涨至全年最高点,而后受原油及外盘持续下滑影响,成交出现回落,至2018年年末价格水平已远远低于上年水平。
1.3深加工情况国内液化石油气深加工产能主要集中在山东、东北、西北、华东等地,其中山东尤为密集,占据全国份额的42%,究其原因主要与山东地炼数量多且分布较为密集有关;另外地理关系也较为重要,东北、西北、华北等地工业原料气均可流入,而东部靠海,东营港等多个港口方便资源进出。随着资源与市场的发展成熟,很多新装置筹备投产也优先出现在山东,由于市场的激烈竞争迫使企业寻求新的变化和格局。
2018年MTBE(甲基叔丁基醚)和烷基化装置运作是大起大落,上半年的原油大涨推动了市场终端需求增加,且部分炼厂的检修停工,促使了深加工装置处于高负荷运行状态。然而下半年国际原油价格暴跌,利空国内油品市场,作为工业原料气的醚后碳四需求疲软,各地企业考虑到产能过剩的影响,为规避风险减少损失,令深加工装置减产降负,也最终导致了醚后碳四价格大幅暴跌,山东地区工业原料气价格水平已基本与民用气价格持平。
2 液化石油气价格影响因素分析
2.1国内液化石油气价格主要影响因素分析
国内液化石油气市场地区特征十分明显,不同地区液化石油气价格影响因素各有差异,但主要还是受到供应、需求、库存等基本面因素的影响,除此之外,还受到国际液化石油气价格、国际石油价格、国际天然气价格、石脑油价格、国际液化石油气价格等价格因素影响,也受到天气、交通运输、突发事件以及宏观经济等方面的因素影响。
国内液化石油气价格影响因素十分复杂,但是最主要的影响因素有:一是需求因素,尤其是周边及大客户的需求,如果需要强劲,将推动液化石油气价格上涨,反之将推动液化石油气价格下降。二是供应因素,当一个地区的供应紧张或供应中断,将造成供不应求,也将促使液化石油气价格上涨,反之将促使液化石油气价格下降。三是库存,包含供应方库存和需求方库存,当供应商库存增加,将抑制液化石油气价格上涨,反之将促进液化石油气价格上涨;但当用户的库存增加,将促进液化石油气价格下降,反之将促进液化石油气价格上涨。四是国际液化石油气价格,国内液化石油气价格还受到国内液化石油气价格,特别是沙特CP价格影响;国际液化石油气价格上涨,将带动国内液化石油气价格上涨,反之将促进国内外液化石油气价格下跌。五是突发事件,比如恶劣天气导致的交通运输问题,比如台风造成国际液化石油气船无法抵达港口,将导致供应中断,可能导致周边地区液化石油气价格猛涨。
2.2西南地区液化石油气价格形成机制分析
长庆石化方面,在烷基化装置开工前,资源按产品品质细分为民用气和工业气。目前全部销售民用气,长庆石化产品安全库容2160吨,日产量约340吨,主要销往陕西、湖北、四川、重庆等区域。长庆石化资源销售量占陕西省民用气市场40%份额。
长庆石化民用气公路销售价格主要受延炼实际结算价、库存、运输等影响。长庆石化民用气公路销售价格主要影响因素:国际原油、CP价格;区域内竞争对手销售价格水平;炼厂产量、库存变化,炼厂生产工艺调整,装置检修,产品储罐调整以及临时故障,都可能会引起炼厂产量、库存变动,从影响销售价格;买断价;极端天气,冬季极端大雪封路严重影响运输,运输车辆不足库存积累,影响价格水平;运力情况,运力、公司备用库库存及营销整体销售策略安排,在炼厂库存高位需要排库时,会影响价格制定。
云南石化方面,目前销售民用气,云南石化民用气日产量800吨,主要销售云南、贵州、重庆、四川,民用气销量占云南燃气市场70%左右市场份额。云南石化民用气公路销售价格主要受广西中油进口气和广西石化资源影响。云南石化民用气公路销售价格影响因素:炼厂产量、库存变化,炼厂原油加工量增加,生产方案调整,配套深加工装置检修或故障,导致资源供应大增,影响价格水平。竞争对手、替代资源价格及资源投放变化。季节影响,云南石化液化石油气冬季气压低,客户认可度低,需求量下降。台风影响华南液化石油气到船,资源整体抽库存低位价格看涨。炼厂控制出货计划,导致库存积累。码头进口气集中到船,卸货压力下进口气跌价排库进口气资源增加。CP价大幅波动,进口气成本变化,影响云南石化销价。
3价格预测方法应用
从大数据平台中包含的石油、天然气、煤炭、电力和新能源等专业信息中按关键词液化石油气、液化气、天然气、原油进行搜索,从5071.1万条53.8T(2019年9月16日)的数据中搜索2014年-2019年的信息,得出“液化石油气”信息57057条,“液化气”信息514537条,“天然气”信息2038222条,“原油”信息2103814条。
对所有这些信息进行分词、无意义词去除、人工去掉无用词,最后进行词频排序处理得到四个关键词的相关近义词词表,如图的词云所示,词的频次越高字体越大。该方法得到的搜索结果的近义词,利用词云技术绘制成如下图2到图5可以进一步应用在相关业务研究中通过可视化各主题的近义词发现词频同相关价格间的关系。对四个词的相关近义词按日进行词频统计,得出下图6到7。按照理论,相关近义词的词频越高说明相关产品最近的价格波动就会越大。数值数据处理方面,根据数据可获得性、数据频次要求和数据质量要求,最终选择了液化石油气数据进行预测方法试用。为了进一步扩展数据集,考虑到更多的因素,需从时间、地域、业务三个方面对现有数据进行特征挖掘,发现新的特征、拓展影响因素。对获得的数据集进行清洗及归一化处理,如图8所示。
程序实现方面,以Python为基础语言,用ElasticSearch开源包进行大数据检索,用LightGBM为基础算法,用MySql进行计算数据存储,在大数据集群中进行分布式的词频统计和回归计算,超参数采用计算框架默认参数,通过前期液化石油气价格数据、区内中石化炼厂历史数据、国际原油数据,以及本文新加的相关新闻词频数据预测所需的价格数据。
将训练完成的模型运用在2019年3—8月的价格预计任务中(图9),通过对比纯数值预测和文本+数值预测的结果可以发现,在预测西南石化液化石油气产品价格的任务中,文本+数值预测模型的预测相对精度采用平方均值误差(MSE,meansquareerror)来衡量,由95.7%提至96.9%,1.2%的精度提升意味着近50元/吨的价格提升,表明着文本+数值方法的预测精度更高。
从预测的整体结果还可看出,文本+数值的预测方法对于价格大幅波动的适应能力更强。
4总结
本文通过大规模的文本信息中的石油行业相关关键词和相近词的收集和整理,结合数值预测方法,建立了一套基于大数据的文本挖掘预测方法,并编写了相关预测程序。该方法成功应用于液化石油气价格的预测中,程序计算的结果表明在本文数据引入的情况下价格预测精度取得了进步。
经过以上应用尝试,还需持续跟踪基于文本预测方法的发展,通过人工进一步筛选和算法修改,提高近义词的相关程度,通过进一步的参数优化提高模型预测精度和适用性。同时,受专业能力和数据限制,现有模型进一步应用被局限,希望能与其他所进一步交流相关业务知识,获取能够满足模型要求的数据,进一步拓展模型的试用范围。

536
点击量
1
下载量

刊出日期:2023.3上旬
主管单位:中国石油天然气集团有限公司
主办单位:中国石油企业协会,中国石油企业协会海洋石油分会
国际标准刊号:ISSN 1672-4267
国内统一刊号:CN11-5023/F
国外发行代号:M1803
国内邮政编码:100724
广告经营许可证号:京西工商广字第0433号(1-1)