コンテンツにスキップ

WISDM Dataset Loader

WISDM

WISDMデータセットに記録されているセンサデータとメタデータを読み込む.

Parameters:

Name Type Description Default
path Path

WISDMデータセットのパス.

required

load(self, window_size, stride, ftrim_sec=3, btrim_sec=3, subjects=None)

WISDMデータセットを読み込み,sliding-window処理を行ったデータを返す.

Parameters:

Name Type Description Default
window_size int

フレーム分けするサンプルサイズ

required
stride int

ウィンドウの移動幅

required
ftrim_sec int

セグメント先頭のトリミングサイズ(単位は秒)

3
btrim_sec int

セグメント末尾のトリミングサイズ(単位は秒)

3
subjects Optional[list]

ロードする被験者を指定する.指定されない場合はすべての被験者のデータを返す. 被験者は計36名おり,それぞれに整数のIDが割り当てられている.値の範囲は[1, 36].

None

Examples:

>>> wisdm_path = Path('path/to/dataset')
>>> wisdm = WISDM(wisdm_path)
>>>
>>> # 被験者1, 2, 3のみを読み込む
>>> x, y = wisdm.load(window_size=256, stride=256, ftrim_sec=0, btrim_sec=0, subjects=[1, 2, 3])
>>> print(f'x: {x.shape}, y: {y.shape}')
>>>
>>> # > x: (?, 3, 256), y: (?, 2)

Returns:

Type Description
Tuple[numpy.ndarray, numpy.ndarray]

sliding-windowで切り出した入力とターゲットのフレームリスト

x_framesは3次元配列で構造は大まかに(Batch, Channels, Frame)のようになっている. Channelsは加速度センサの軸を表しており,先頭からx, y, zである.

y_framesは2次元配列で構造は大まかに(Batch, Labels)のようになっている. Labelsは先頭から順にactivity,subjectを表している. y_framesではデータセット内の値をそのまま返すため,分類で用いる際はラベルの再割り当てが必要となることに注意.

load(path)

Function for loading WISDM dataset

Parameters:

Name Type Description Default
path Union[pathlib.Path, str]

Directory path of WISDM dataset('data' directory)

required

Returns:

Type Description
Tuple[List[pandas.core.frame.DataFrame], List[pandas.core.frame.DataFrame]]

Sensor data segmented by activity and subject

load_raw(path)

Function for loading raw data of WISDM dataset

Parameters:

Name Type Description Default
path Path

Directory path of WISDM dataset('data' directory)

required

Returns:

Type Description
DataFrame

raw data of WISDM dataset