所以说都写了同一个户主的名字,那么我们就可以用户主那个变量当作household id. 如果你的数据是string的,你可以encode该变量,使其变成numerical的变量。这样sum一下你就知道一共有多少户人家了,要知道每一户有多少人,你可以(bysort hhid:) gen hh_no=hhid[_n] if _n>=1 (括号里可能要加可能不加,不确定)。。。你自己help _n or _N了解detail 也好。