USC-HAD Dataset Loader
USC_HAD
USC-HADデータセットに記録されているセンサデータとメタデータを読み込む.
Parameters:
Name | Type | Description | Default |
---|---|---|---|
path |
Path |
USC-HADデータセットのパス(path/to/dataset/"). |
required |
Attributes:
Name | Type | Description |
---|---|---|
supported_x_labels |
List[str] |
ターゲット以外のすべてのラベルのリスト |
supported_y_labels |
List[str] |
ターゲットラベルのリスト |
load(self, window_size, stride, x_labels=None, y_labels=None, ftrim_sec=5, btrim_sec=5, subjects=None)
USC-HADデータセットを読み込み,sliding-window処理を行ったデータを返す.
Parameters:
Name | Type | Description | Default |
---|---|---|---|
window_size |
int |
フレーム分けするサンプルサイズ |
required |
stride |
int |
ウィンドウの移動幅 |
required |
x_labels |
Optional[list] |
入力(従属変数)のラベルリスト(ラベル名は元データセットに準拠).ここで指定したラベルのデータが入力として取り出される. |
None |
y_labels |
Optional[list] |
ターゲットのラベルリスト(仕様はx_labelsと同様) |
None |
ftrim_sec |
int |
セグメント先頭のトリミングサイズ(単位は秒) |
5 |
btrim_sec |
int |
セグメント末尾のトリミングサイズ(単位は秒) |
5 |
subjects |
Optional[list] |
ロードする被験者を指定する.指定されない場合はすべての被験者のデータを返す. 被験者は計9名おり,それぞれにIDが割り当てられている. 被験者ID: [1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14] |
None |
Examples:
>>> usc_had_path = Path('path/to/dataset/')
>>> usc_had = USC_HAD(ucs_had_path)
>>>
>>> x_labels = ['acc_x', 'acc_y', 'acc_z']
>>> y_labels = ['activity', 'subject']
>>> x, y = usc_had.load(x_labels=xlabels, y_labels=y_labels)
>>> print(f'x: {x.shape}, y: {y.shape}')
>>>
>>> # > x: (?, 3, 125), y: (?, 1)
Returns:
Type | Description |
---|---|
Tuple[numpy.ndarray, numpy.ndarray] |
sliding-windowで切り出した入力とターゲットのフレームリスト x_framesは3次元配列で構造は大まかに(Batch, Channels, Frame)のようになっている. Channelsはx_labelsで指定したものが格納される. y_framesは2次元配列で構造は大まかに(Batch, Labels)のようになっている. Labelsはy_labelsで指定したものが格納される. y_framesはデータセット内の値をそのまま返すため,分類で用いる際はラベルの再割り当てが必要となることに注意する. |
load(path)
Function for loading USC-HAD dataset
Parameters:
Name | Type | Description | Default |
---|---|---|---|
path |
Union[pathlib.Path, str] |
Directory path of USC-HAD dataset. |
required |
Returns:
Type | Description |
---|---|
Tuple[List[pandas.core.frame.DataFrame], List[pandas.core.frame.DataFrame]] |
Sensor data segmented by activity and subject. |
load_raw(path)
Function for loading raw data of USC-HAD dataset
Parameters:
Name | Type | Description | Default |
---|---|---|---|
path |
Path |
Directory path of USC-HAD dataset. |
required |
Returns:
Type | Description |
---|---|
List[pandas.core.frame.DataFrame] |
Raw data of USC-HAD dataset. Each item in 'chunks' is a part of dataset, which is splited by activity and subject. |