

SensorBench 是一个用于评估大型语言模型(LLMs)在基于编码的传感器处理任务中的性能的基准数据集。该数据集旨在通过提供多种传感器数据处理问题,测试和比较不同模型的表现。
安装依赖包: bash pip install -r requirements.txt
使用Docker(可选):
构建Docker镜像: bash docker build -t my-python-app .
构建Docker容器: bash docker run -p 4000:80 -v ./:/usr/src/myapp --name my-container my-python-app /bin/bash
启动容器: bash docker start my-container
在容器中执行代码: bash docker exec -it my-container /bin/bash
或 bash docker exec -it my-container2 python cli.py --mode api --query ecg_data-powerline_2 --openai gpt-4 --index 1 --num_trial 1
OpenAI密钥:将OpenAI密钥放入key.txt
文件中。
bash
echo "YOUR_OPENAI_TOKEN" >> key.txt
together.ai密钥(可选):将together.ai密钥放入together_key.txt
文件中。
bash
echo "YOUR_TOGETHER_AI_TOKEN" >> together_key.txt
--mode:选择模式,包括text
、api
、no_api
、CoT
、react
、base
。
text
:以数值形式向LLMs提供信号。api
:Python编码环境 + API访问 + 检查 + ReACT提示。no_api
:Python编码环境 + 检查 + ReACT提示。CoT
:Python编码环境 + API访问 + 思维链提示。ReAct
:Python编码环境 + API访问 + ReAct提示。base
:Python编码环境 + API访问。--model:选择模型,包括gpt-3.5-turbo
、gpt-4
、gpt-4o
、gpt-4-0125-preview
、gpt-4-turbo
、Llama-2-70b
、Llama-2-13b
、Llama-2-7b
、Llama-3-8b
、Llama-3-70b
、Qwen1.5-110B
、Qwen2-72B
。
--query:选择信号处理问题类型,包括ecg_data-extrapolation
、ecg_data-gaussian
、ecg_data-heartrate
、ecg_data-imputation
、ecg_data-motion
、ecg_data-powerline_1
、ecg_data-powerline_2
、ecg_data-powerline_3
、gait-delay_detection
、gait-period_detection
、ppg-extrapolation
、ppg-imputation
、resampling
、speech-echo
、speech-Siren
、speech-TelephoneRing1
、speech-TelephoneRing2
、speech-TelephoneRing3
、change_point_detect_1
、change_point_detect_2
、change_point_detect_3
、change_point_detect_4
、outlier_detect_1
、outlier_detect_2
、outlier_detect_3
、outlier_detect_4
。
--index:选择数据样本的索引,index
∈ {1, 2, 3}。
--num_trial:设置自我验证的轮数,num_trial
∈ {1, 3, 4, 5}。
sys_prompt.py
文件中定义提示策略,用户可以添加或修改提示以构建自己的代理。