引用本文:
【打印本页】   【HTML】   【下载PDF全文】   查看/发表评论  【EndNote】   【RefMan】   【BibTex】
←前一篇|后一篇→ 过刊浏览    高级检索
本文已被:浏览 1243次   下载 39 本文二维码信息
码上扫一扫!
分享到: 微信 更多
一种二元响应变量模型的分布式贝叶斯估计方法
吴磊,钱夕元
作者单位E-mail
吴磊 华东理工大学理学院, 上海 200237  
钱夕元 华东理工大学理学院, 上海 200237 xyqian@ecust.edu.cn 
摘要:
在海量数据背景下,传统的基于单个计算节点的算法很难满足分析要求。考察了一种分布式贝叶斯估计方法,通过在每台机器上单独运行蒙特卡洛抽样并做加权平均可以有效地解决算法效率问题。将该方法应用于基于广义极值模型的二元响应变量回归分析,并探讨其实用性。模拟研究表明分布式算法比传统方法更有效。
关键词:  海量数据  分布式贝叶斯方法  极值模型
DOI:10.14135/j.cnki.1006-3080.2017.04.016
分类号:TP301.6
基金项目:国家高科技研究发展("863")计划(2015AA20107);上海市经信委"软件和集成电路产业发展专项资金"(140304)
A Distributed Bayesian Regression Method for Binary Response Massive Data
WU Lei,QIAN Xi-yuan
Abstract:
In the background of massive data,it is difficult to meet the analysis requirements for traditional one-node based algorithm.This paper considers a distributed Bayesian estimation method to solve the GEV based general linear regression model by running a separate Monte Carlo algorithm on each machine.The method is applied to regression analysis of binary response variables based on generalized extreme value model.The results show that the proposed distributed Bayesian regression algorithm is much faster than the traditional algorithm in the simulated data sets studying.
Key words:  massive data  distributed Bayesian regression  GEV model

地址:上海市梅陇路130号华东理工大学研究生楼1015室 邮编:200237

电话:021-64253812 传真:021-64253812 电子信箱: ecustxbb@ecust.edu.cn