A dataset of video clips with spoken and visual attributes

Video Datasets

Real-World Activities of Daily Living

Download Dataset Download Sample Request Quote Request Sample

Files

2000

Size

Format

wav

Duration

Country

Worldwide

Participants

100

Languages

Updated

January 27, 2023

Description

Dataset has been designed for the activity classification task of 31 activities. The videos were clipped per activity, resulting in a total of 2,000 short RGB+D video samples. Activities were performed in a natural manner. As a result, the dataset poses a unique combination of challenges: high intra-class variation, high-class imbalance, and activities with similar motion and high duration variance. Example: Make coffee, pour water, add sugar, etc.

Dataset Technical Specification

Number of files:

2000

Total dataset size:

Duration:

Format:

wav

Sample rate:

Resolution:

Dataset Demographics

📍 Country:

Worldwide

🧍 Gender:

M/F 50-50%

📅 Age:

18-55

👥 Number of participants:

100

🛡️ Consent & Compliance

Download Dataset Download Sample Request Quote Request Sample

A dataset of video clips with spoken and visual attributes

Description

Sample Download

Licence

Version Info

Dataset Technical Specification

Dataset Demographics

🛡️ Consent & Compliance

Casual Conversations Dataset

Lip Reading in the Wild (LRW)

Audio-visual speech with multiple speakers

A dataset for lipreading using sequences of video frames

Fire Videos Data

Audio-visual emotion recognition

AI Solutions

Resources

Hire Experts

A dataset of video clips with spoken and visual attributes

Description

Sample Download

Licence

Version Info

Dataset Technical Specification

Dataset Demographics

🛡️ Consent & Compliance

Related Datasets

Casual Conversations Dataset

Lip Reading in the Wild (LRW)

Audio-visual speech with multiple speakers

A dataset for lipreading using sequences of video frames

Fire Videos Data

Audio-visual emotion recognition

AI Solutions

Resources

Hire Experts