Test Run

education-academia-phd-researcher-characters-ferdinand-de-saussure-20251031T151404386837 Completed

Test Suite: education-academia-phd-researcher-characters-ferdinand-de-saussure - Maya Rahman

Started

Oct 31, 2025 15:14

Completed

Oct 31, 2025 15:14

Model	Performance	Status	Actions
[email protected]/Qwen3-14B-984c85c4 AI Language Model	0.000	Completed

Judge Model

meta-llama/Meta-Llama-3.1-405B-Instruct-Turbo

Generator Models (1)

[email protected]…

Execution Time

0 minutes

Models Tested

Scenes Executed

Average Performance

0.00

Scene	Name	Result	Model
`greeting-consent`	Participant introduces themselves Test scenario	Failed Error	[email protected]/Qwe…
`corpus-update`	Colleague asks for corpus status Test scenario	Failed Error	[email protected]/Qwe…
`vot-measurement`	Phonetics methodology query Test scenario	Failed Error	[email protected]/Qwe…
`workshop-outline`	Draft community workshop plan Test scenario	Failed Error	[email protected]/Qwe…
`interim-report`	Interim findings summary Test scenario	Failed Error	[email protected]/Qwe…
`send-anonymization-guide`	Follow-up on promised resource Test scenario	Failed Error	[email protected]/Qwe…

Scene	onteripaul@gma…
`greeting-consent` Participant introduces themse…	0.000 Details Error
`corpus-update` Colleague asks for corpus sta…	0.000 Details Error
`vot-measurement` Phonetics methodology query	0.000 Details Error
`workshop-outline` Draft community workshop plan	0.000 Details Error
`interim-report` Interim findings summary	0.000 Details Error
`send-anonymization-guide` Follow-up on promised resource	0.000 Details Error