Skip to content

Latest commit

 

History

History

benchmarks

Benchmarks

Regression for the number of likes

  • task type: regression
  • shift type: target shift
  • shift metric: wasserstein distance
  • train/test sample size
    • train sample size: 100000
    • test sample size: 100000
  • input/output dimension
    • input dimension: 25
    • output dimension: 1
  • number of trials: 20

Ordinal Empirical Risk Minimizations

  • hyperparameters: All hyperparameters are default settings of the scikit-learn.
  • source code is available here.
Models W=0 W=5 W=10 W=15 W=20 W=25 W=30 W=35 W=40 W=45 W=50
Linear Regression 9.364(±0.027) 9.495(±0.033) 10.446(±0.048) 12.689(±0.053) 17.101(±0.060) 23.016(±0.056) 28.800(±0.058) 34.292(±0.047) 39.564(±0.050) 44.462(±0.050) 48.844(±0.056)
RANSAC Regression 10.394(±0.273) 12.408(±1.273) 15.934(±1.223) 19.586(±1.161) 23.700(±1.958) 28.212(±1.398) 33.012(±1.076) 37.573(±1.600) 42.726(±1.334) 47.380(±1.358) 53.038(±0.890)
Huber Regression 30.347(±0.939) 30.428(±0.816) 31.025(±0.712) 32.496(±0.598) 35.211(±0.475) 38.747(±0.463) 42.474(±0.391) 46.224(±0.396) 49.836(±0.302) 53.244(±0.268) 56.524(±0.221)
TheilSen Regressor 9.968(±0.092) 10.130(±0.077) 11.117(±0.061) 13.423(±0.087) 17.779(±0.074) 23.499(±0.111) 29.136(±0.122) 34.476(±0.106) 39.661(±0.102) 44.465(±0.105) 48.838(±0.102)
Decision Tree 12.828(±0.059) 14.293(±0.096) 16.671(±0.124) 19.462(±0.197) 22.182(±0.305) 25.387(±0.251) 29.131(±1.396) 33.152(±0.396) 37.046(±0.166) 41.240(±0.325) 44.959(±0.498)

Importance Weighted Empirical Risk Minimizations

Models W=0 W=5 W=10 W=15 W=20 W=25 W=30 W=35 W=40 W=45 W=50
Linear Regression 9.364(±0.027) 9.495(±0.033) 10.446(±0.048) 12.689(±0.053) 17.101(±0.060) 23.016(±0.056) 28.800(±0.058) 34.292(±0.047) 39.564(±0.050) 44.462(±0.050) 48.844(±0.056)
IWERM (optimal) 9.364(±0.027) 11.633(±0.049) 25.678(±0.128) 32.993(±0.123) 32.589(±0.121) 30.022(±0.117) 26.834(±0.119) 23.478(±0.091) 20.197(±0.103) 17.166(±0.141) 14.528(±0.106)
RIWERM (alpha=0.25) 9.364(±0.027) 9.319(±0.029) 9.348(±0.044) 9.367(±0.040) 9.539(±0.035) 10.237(±0.050) 11.378(±0.048) 12.967(±0.055) 14.895(±0.097) 16.428(±0.141) 17.007(±0.147)
RIWERM (alpha=0.5) 9.364(±0.027) 9.414(±0.026) 9.734(±0.044) 9.901(±0.044) 9.573(±0.035) 9.338(±0.040) 9.690(±0.041) 10.722(±0.054) 12.378(±0.106) 13.923(±0.154) 14.685(±0.153)
RIWERM (alpha=0.75) 9.364(±0.027) 9.903(±0.025) 11.594(±0.051) 12.222(±0.061) 11.355(±0.053) 10.086(±0.040) 9.397(±0.038) 9.493(±0.042) 10.465(±0.095) 11.765(±0.146) 12.607(±0.143)

Regression for the sum of prices

  • task type: regression
  • shift type: covariate shift, target shift
  • shift metric: wasserstein distance
  • train/test sample size
    • train sample size: 100000
    • test sample size: 100000
  • input/output dimension
    • input dimension: 1
    • output dimension: 1
  • number of trials: 20

Covariate shift

  • hyperparameters: All hyperparameters are default settings of the scikit-learn.
  • source code is available here.
Models W=8x104 W=5 W=10 W=15 W=20 W=25 W=30 W=35 W=40 W=45 W=50
Linear Regression 82778(±9435) 86615(±13118) 85064(±10309) 87196(±10894) 87140(±12436) 87476(±14904) 91157(±25153) 88163(±9375) 88112(±10286) 95093(±10046) 96432(±10204)
RANSAC Regression 76914(±9202) 76527(±10397) 75761(±9358) 75739(±9863) 76489(±9382) 78749(±11087) 76710(±9418) 78641(±11050) 78834(±11967) 77149(±9119 81181(±12176)
Huber Regression 73354(±9241) 73360(±9245) 73367(±9241) 73363(±9248) 73355(±9246) 73380(±9240) 73421(±9242) 73515(±9226) 73713(±9211) 73859(±9246) 73842(±9248)
TheilSen Regressor 73523(±9251) 73443(±9288) 73423(±9191) 73348(±9222) 73296(±9240) 73319(±9240) 73436(±9220) 73878(±9137) 74761(±9220) 75489(±8807) 76434(±9027)
Decision Tree 83210(±9575) 86494(±13001) 84632(±10616) 86534(±11851) 86661(±14653) 86944(±19528) 89882(±31520) 83348(±9259) 83585(±9584) 84730(±9165) 85301(±9049)

Target shift

Ordinal Empirical Risk Minimizations

Models W=7.0x104 W=7.4x104 W=8x104 W=8.6x104 W=1.0x105 W=1.1x105 W=1.3x105 W=1.4x105 W=1.6x105
Linear Regression 28968(±16869) 48801(±7800) 56422(±14803) 64515(±11119) 66874(±8715) 72821(±8722) 96922(±587) 136737(±52) 160761(±41)
RANSAC Regression 87633(±7669) 109526(±7314) 113917(±7556) 114921(±9428) 113859(±8332) 117925(±6106) 122782(±5122) 139154(±2511) 159913(±590)
Huber Regression 70926(±273) 87634(±274) 96517(±297) 99769(±270) 100896(±265) 103645(±240) 113396(±110) 137322(±51) 160273(±40)
TheilSen Regressor 63648(±608) 78095(±698) 86764(±1121) 89717(±969) 90725(±726) 93161(±901) 104869(±1143) 134104(±611) 159104(±212)
Decision Tree 56796(±30456) 70309(±35602) 72495(±21728) 75994(±28506) 84841(±38077) 78910(±12009) 95302(±650) 136542(±55) 160755(±39)

Importance Weighted Empirical Risk Minimizations

Models W=7.0x104 W=7.4x104 W=8x104 W=8.6x104 W=1.0x105 W=1.1x105 W=1.3x105 W=1.4x105 W=1.6x105
Linear Regression 28968(±16869) 48801(±7800) 56422(±14803) 64515(±11119) 66874(±8715) 72821(±8722) 96922(±587) 136737(±52) 160761(±41)
IWERM (optimal) 9400(±51) 9336(±60) 9250(±87) 9211(±69) 9142(±47) 9096(±43) 9070(±63) 43724(±33871) 152675(±339)
RIWERM (alpha=0.25) 11252(±124) 11149(±146) 10981(±200) 10962(±195) 10862(±154) 10960(±157) 11206(±247) 39784(±26672) 152675(±339)
RIWERM (alpha=0.5) 10551(±102) 10456(±124) 10306(±178) 10289(±154) 10199(±126) 10247(±124) 10400(±195) 41988(±30706) 152675(±339)
RIWERM (alpha=0.75) 10012(±81) 9929(±99) 9803(±147) 9779(±119) 9700(±97) 9709(±93) 9784(±147) 43058(±32670) 152675(±339)

Template

  • task type:

  • shift type:

  • shift metric:

  • train/test sample size

    • train sample size:
    • test sample size:
  • input/output dimension

    • input dimension:
    • output dimension:
  • number of trials:

  • hyperparameters:

  • source code is

Models W=0 W=5 W=10 W=15 W=20 W=25 W=30 W=35 W=40 W=45 W=50
Model 1 (±) (±) (±) (±) (±) (±) (±) (±) (±) (±) (±)
Model 2 (±) (±) (±) (±) (±) (±) (±) (±) (±) (±) (±)

References

  • [1] Shimodaira, Hidetoshi. "Improving predictive inference under covariate shift by weighting the log-likelihood function." Journal of statistical planning and inference 90.2 (2000): 227-244.
  • [2] Yamada, Makoto, et al. "Relative density-ratio estimation for robust distribution comparison." Neural computation 25.5 (2013): 1324-1370.