do-competitively

Execute tasks through competitive generation, multi-judge evaluation, and evidence-based synthesis to produce superior results.

Purpose - Generate multiple solutions competitively, evaluate with independent judges, synthesize best elements
Pattern - Generate-Critique-Synthesize (GCS) with self-critique, verification loops, and adaptive strategy selection
Output - Superior solution combining best elements from all candidates
Quality - Enhanced with Constitutional AI self-critique, Chain of Verification, and intelligent strategy selection
Efficiency - 15-20% average cost savings through adaptive strategy (polish clear winners, redesign failures)

Pattern: Generate-Critique-Synthesize (GCS)

This command implements a four-phase adaptive competitive orchestration pattern with quality enhancement loops:

Phase 1: Competitive Generation with Self-Critique
         ┌─ Agent 1 → Draft → Self-Critique → Revise → Solution A ─┐
Task ───┼─ Agent 2 → Draft → Self-Critique → Revise → Solution B ─┼─┐
         └─ Agent 3 → Draft → Self-Critique → Revise → Solution C ─┘ │
                                                                  │
Phase 2: Multi-Judge Evaluation with Verification                │
         ┌─ Judge 1 → Evaluate → Verify → Revise → Report A ─┐  │
         ├─ Judge 2 → Evaluate → Verify → Revise → Report B ─┼──┤
         └─ Judge 3 → Evaluate → Verify → Revise → Report C ─┘  │
                                                                  │
Phase 2.5: Adaptive Strategy Selection                           │
         Analyze Consensus ──────────────────────────────────────┤
                ├─ Clear Winner? → SELECT_AND_POLISH             │
                ├─ All Flawed (<3.0)? → REDESIGN (return Phase 1)│
                └─ Split Decision? → FULL_SYNTHESIS              │
                                          │                       │
Phase 3: Evidence-Based Synthesis        │                       │
         (Only if FULL_SYNTHESIS)         │                       │
         Synthesizer ─────────────────────┴───────────────────────┴─→ Final Solution

Usage

# Basic usage
/do-competitively <task-description>

# With explicit output specification
/do-competitively "Create authentication middleware" --output "src/middleware/auth.ts"

# With specific evaluation criteria
/do-competitively "Design user schema" --criteria "scalability,security,developer-experience"

When to Use

Use this command when:

Quality is critical - Multiple perspectives catch flaws single agents miss
Novel/ambiguous tasks - No clear "right answer", exploration needed
High-stakes decisions - Architecture choices, API design, critical algorithms
Learning/evaluation - Compare approaches to understand trade-offs
Avoiding local optima - Competitive generation explores solution space better

Do NOT use when:

Simple, well-defined tasks with obvious solutions
Time-sensitive changes
Trivial bug fixes or typos
Tasks with only one viable approach

Quality Enhancement Techniques

Techniques that were used to enhance the quality of the competitive execution pattern.

Phase

Technique

Benefit

Phase 1

Constitutional AI Self-Critique

Generators review and fix their own solutions before submission, catching 40-60% of issues

Phase 2

Chain of Verification

Judges verify their evaluations with structured questions, improving calibration and reducing bias

Phase 2.5

Adaptive Strategy Selection

Orchestrator parses structured judge outputs (VOTE+SCORES) to select optimal strategy, saving 15-20% cost on average

Phase 3

Evidence-Based Synthesis

Combines proven best elements rather than creating new solutions (only when needed)

Theoretical Foundation

The competitive execution pattern combines insights from:

Academic Research:

Multi-Agent Debate (Du et al., 2023) - Diverse perspectives improve reasoning
Self-Consistency (Wang et al., 2022) - Multiple reasoning paths improve reliability
Tree of Thoughts (Yao et al., 2023) - Exploration of solution branches before commitment
Constitutional AI (Bai et al., 2022) - Self-critique loops catch 40-60% of issues before review
Chain-of-Verification (Dhuliawala et al., 2023) - Structured verification reduces bias
LLM-as-a-Judge (Zheng et al., 2023) - Structured evaluation rubrics

Engineering Practices:

Design Studio Method - Parallel design, critique, synthesis
Spike Solutions (XP/Agile) - Explore approaches, combine best
A/B Testing - Compare alternatives with clear metrics
Ensemble Methods - Combining multiple models improves performance

Previousdo-and-judge Nextdo-in-parallel

Last updated 3 hours ago

hashtagPattern: Generate-Critique-Synthesize (GCS)

hashtagUsage

hashtagWhen to Use

hashtagQuality Enhancement Techniques

hashtagTheoretical Foundation

Pattern: Generate-Critique-Synthesize (GCS)

Usage

When to Use

Quality Enhancement Techniques

Theoretical Foundation