以前まではSPSSで大量データを扱う高速な環境を用意しようとすると、何千万もかかりました。

いまはクラウドも普及してSPSSも安いライセンスが出てきたりして敷居が下がったように思えます。

PythonとかRもいいんですが、やはりUIがついているSPSSは使いやすいです。SPSS Modelerの方ですよ。

どんな構成がいいかですが安く大量データを扱うなら
Redshift+SPSS Modeler(サブスクリプションライセンス)
Redshiftは小さいインスタンスを選択して、Modelerも月額数万なので月10万以内で使えてしまいます。しかもRedshiftはPushbackに対応しているので性能も授受する事が出来ます。

Redshift ○ Read/Write/Pushback
 AWSはS3とかも対応されればいいのですが。
Bigquery ○ Read × Write/Pushback
 Bigqueryにも早く対応してほしいです。