重複したオブザベーションを削除したい。
SORTプロシジャを利用します。
構文
PROC SORT DATA = ソート前のデータセット OUT = ソート後のデータセット NODUPKEY; BY ソートキー; RUN;
proc sortはソートするプロシジャですが、nodupkeyオプションをつけることで、ソートしたあとにbyステートメントで指定した変数をキーとして重複削除ができます。
例
ソート前のデータセットを準備
data DummyData; input AGE SEX $ NAME $; cards; 20 F Tanaka 22 M Aoki 30 M Sato 25 M Suzuki 33 F Aoki 40 F Fujii ; run;
![](https://ymddttm.com/wp-content/uploads/2020/07/2020-0704_01-1.png)
やってみる
proc sort data = DummyData out = sorted nodupkey; by NAME; run;
![](https://ymddttm.com/wp-content/uploads/2020/07/2020-0704_02.png)
NAME = “Aoki”の重複オブザベーションが削除されました。
コメント