我正在更新一些计算,其中我使用pymc2到pymc3,当我在模型上有一些离散的随机变量时,我在采样器行为方面遇到了一些问题.例如,请考虑使用pymc2的以下模型:
import pymc as pm N = 100 data = 10 p = pm.Beta('p',alpha=1.0,beta=1.0) q = pm.Beta('q',beta=1.0) A = pm.Binomial('A',N,p) X = pm.Binomial('x',A,q,observed=True,value=data)
它并不代表任何东西,它只是一个模型,其中一个未观察到的变量是离散的.当我用pymc2对这个模型进行采样时,我得到以下结果:
mcmc = pm.MCMC(model) mcmc.sample(iter=100000,burn=50000,thin=100) plot(mcmc)
但是当我尝试使用PYMC3时,我得到了这个:
with pm.Model() as model: N = 100 p = pm.Beta('p',beta=1.0) q = pm.Beta('q',beta=1.0) A = pm.Binomial('A',p) X = pm.Binomial('x',observed=10) with model: start = pm.find_MAP() with model: step = pm.NUTS() trace = pm.sample(3000,step,start) pm.traceplot(trace)
看起来变量A根本没有被采样.我没有读过很多关于pymc3中使用的采样方法,但我注意到它似乎特别针对连续模型.这是否意味着它排除了模型上的离散未观察变量,或者是否有某种方法可以做我想做的事情?
解决方法
NUTS采样器不适用于离散变量(尽管人们正在努力推广它).您要做的是为不同类型的变量分配不同的步骤方法.例如:
step1 = pm.NUTS(vars=[p,q]) step2 = pm.Metropolis(vars=[A]) trace = pm.sample(3000,[step1,step2],start)