From d4829238041c0e0ca7586a7871739b4a75c7fbab Mon Sep 17 00:00:00 2001
From: Travis Vasceannie <travis.vas@gmail.com>
Date: Fri, 19 Sep 2025 13:34:17 +0000
Subject: [PATCH] xx

---
 .env                                          |     1 +
 .env.example                                  |     3 +
 .vscode/settings.json                         |    41 +-
 docs/feeds.md                                 |   307 +-
 .../tui/__pycache__/styles.cpython-312.pyc    |   Bin 47261 -> 47623 bytes
 .../__pycache__/dashboard.cpython-312.pyc     |   Bin 34012 -> 31026 bytes
 .../__pycache__/dialogs.cpython-312.pyc       |   Bin 17158 -> 17867 bytes
 .../__pycache__/documents.cpython-312.pyc     |   Bin 18900 -> 23692 bytes
 ingest_pipeline/cli/tui/screens/dashboard.py  |    75 +-
 ingest_pipeline/cli/tui/screens/dialogs.py    |    38 +-
 ingest_pipeline/cli/tui/screens/documents.py  |   116 +-
 ingest_pipeline/cli/tui/styles.py             |    41 +-
 .../utils/__pycache__/runners.cpython-312.pyc |   Bin 6961 -> 5161 bytes
 .../storage_manager.cpython-312.pyc           |   Bin 24918 -> 25251 bytes
 ingest_pipeline/cli/tui/utils/runners.py      |    41 +-
 .../cli/tui/utils/storage_manager.py          |    26 +-
 .../__pycache__/settings.cpython-312.pyc      |   Bin 9806 -> 10453 bytes
 ingest_pipeline/config/settings.py            |    13 +-
 .../core/__pycache__/models.cpython-312.pyc   |   Bin 9557 -> 11783 bytes
 ingest_pipeline/core/models.py                |    78 +-
 .../__pycache__/ingestion.cpython-312.pyc     |   Bin 30027 -> 30021 bytes
 .../__pycache__/scheduler.cpython-312.pyc     |   Bin 4204 -> 4235 bytes
 ingest_pipeline/flows/scheduler.py            |    12 +-
 .../__pycache__/firecrawl.cpython-312.pyc     |   Bin 25327 -> 28485 bytes
 ingest_pipeline/ingestors/firecrawl.py        |   130 +-
 .../storage/__pycache__/base.cpython-312.pyc  |   Bin 7680 -> 14107 bytes
 .../__pycache__/openwebui.cpython-312.pyc     |   Bin 31504 -> 27878 bytes
 .../__pycache__/weaviate.cpython-312.pyc      |   Bin 43251 -> 44001 bytes
 ingest_pipeline/storage/base.py               |   135 +-
 ingest_pipeline/storage/openwebui.py          |   349 +-
 .../r2r/__pycache__/storage.cpython-312.pyc   |   Bin 40079 -> 50082 bytes
 ingest_pipeline/storage/r2r/storage.py        |   253 +-
 ingest_pipeline/storage/types.py              |    22 +
 ingest_pipeline/storage/weaviate.py           |    24 +-
 .../metadata_tagger.cpython-312.pyc           |   Bin 15565 -> 16319 bytes
 .../__pycache__/vectorizer.cpython-312.pyc    |   Bin 7724 -> 7910 bytes
 ingest_pipeline/utils/metadata_tagger.py      |    56 +-
 ingest_pipeline/utils/vectorizer.py           |    39 +-
 pyproject.toml                                |     2 +-
 repomix-output.xml                            | 13165 ++++++++--------
 .../conftest.cpython-312-pytest-8.4.2.pyc     |   Bin 22992 -> 24383 bytes
 .../__pycache__/openapi_mocks.cpython-312.pyc |   Bin 41440 -> 52262 bytes
 tests/conftest.py                             |    40 +
 ...est_scheduler.cpython-312-pytest-8.4.2.pyc |   Bin 7574 -> 7522 bytes
 tests/unit/flows/test_scheduler.py            |     8 +-
 ...est_openwebui.cpython-312-pytest-8.4.2.pyc |   Bin 18917 -> 19090 bytes
 ...t_r2r_helpers.cpython-312-pytest-8.4.2.pyc |   Bin 27342 -> 29532 bytes
 tests/unit/storage/test_openwebui.py          |    10 +-
 tests/unit/storage/test_r2r_helpers.py        |     2 +-
 ...hboard_screen.cpython-312-pytest-8.4.2.pyc |   Bin 16098 -> 17750 bytes
 ...st_vectorizer.cpython-312-pytest-8.4.2.pyc |   Bin 10964 -> 10958 bytes
 tests/unit/utils/test_vectorizer.py           |     2 +-
 uv.lock                                       |   157 +-
 53 files changed, 8013 insertions(+), 7173 deletions(-)
 create mode 100644 ingest_pipeline/storage/types.py

diff --git a/.env b/.env
index db5989a..b75aa08 100644
--- a/.env
+++ b/.env
@@ -25,6 +25,7 @@ FIRECRAWL_ENDPOINT=http://crawl.lab:30002
 # Model Configuration
 EMBEDDING_MODEL=ollama/bge-m3:latest
 EMBEDDING_DIMENSION=1024
+METADATA_MODEL=fireworks/glm-4p5-air
 
 # Ingestion Settings
 BATCH_SIZE=50
diff --git a/.env.example b/.env.example
index 9167b21..4211fac 100644
--- a/.env.example
+++ b/.env.example
@@ -2,6 +2,8 @@
 FIRECRAWL_API_KEY=
 OPENWEBUI_API_KEY=
 WEAVIATE_API_KEY=
+LLM_API_KEY=
+OPENAI_API_KEY=
 
 # Endpoints
 LLM_ENDPOINT=http://llm.lab
@@ -12,6 +14,7 @@ FIRECRAWL_ENDPOINT=http://crawl.lab:30002
 # Model Configuration
 EMBEDDING_MODEL=ollama/bge-m3:latest
 EMBEDDING_DIMENSION=1024
+METADATA_MODEL=fireworks/glm-4p5-air
 
 # Ingestion Settings
 BATCH_SIZE=50
diff --git a/.vscode/settings.json b/.vscode/settings.json
index 2217470..1d3f24c 100644
--- a/.vscode/settings.json
+++ b/.vscode/settings.json
@@ -7,14 +7,23 @@
     "python.linting.mypyPath": "./.venv/bin/mypy",
     "python.linting.pylintEnabled": false,
     "python.linting.flake8Enabled": false,
-    "python.analysis.typeCheckingMode": "basic",
+    "python.analysis.typeCheckingMode": "strict",
     "python.analysis.autoImportCompletions": true,
     "python.analysis.stubPath": "./.venv/lib/python3.12/site-packages",
+    "python.analysis.memory.keepLibraryAst": false,
+    "python.analysis.indexing": true,
+    "python.analysis.packageIndexDepths": [
+        {
+            "name": "",
+            "depth": 2
+        }
+    ],
     "basedpyright.analysis.typeCheckingMode": "standard",
     "basedpyright.analysis.autoSearchPaths": true,
     "basedpyright.analysis.autoImportCompletions": true,
     "basedpyright.analysis.diagnosticMode": "workspace",
     "basedpyright.analysis.stubPath": "./.venv/lib/python3.12/site-packages",
+    "basedpyright.analysis.useLibraryCodeForTypes": false,
     "basedpyright.analysis.extraPaths": [
         "./ingest_pipeline",
         "./.venv/lib/python3.12/site-packages"
@@ -29,9 +38,33 @@
         "./.venv/lib/python3.12/site-packages"
     ],
     "files.exclude": {
+        ".mypy_cache": true,
         "**/__pycache__": true,
         "**/.pytest_cache": true,
-        "**/node_modules": true,
-        ".mypy_cache": true
-    }
+        "**/.ruff": true,
+        "**/.uv**": true,
+        "**/.venv": true,
+        "**/node_modules": true
+    },
+    "python.analysis.enableTroubleshootMissingImports": true,
+    "python.analysis.generateWithTypeAnnotation": true,
+    "python.analysis.inlayHints.callArgumentNames": "partial",
+    "python.analysis.languageServerMode": "full",
+    "python.analysis.regenerateStdLibIndices": true,
+    "python.analysis.typeEvaluation.enableExperimentalFeatures": true,
+    "python.analysis.typeEvaluation.strictDictionaryInference": true,
+    "python.analysis.typeEvaluation.strictListInference": true,
+    "python.analysis.typeEvaluation.strictSetInference": true,
+    "python.terminal.activateEnvInCurrentTerminal": true,
+    "python.testing.pytestEnabled": true,
+    "python.useEnvironmentsExtension": true,
+    "editor.formatOnSave": true,
+    "mcp": {},
+    "python.pyrefly.displayTypeErrors": "force-on",
+    "python-envs.defaultEnvManager": "ms-python.python:venv",
+    "python-envs.defaultPackageManager": "charliermarsh.ruff:uv",
+    "python-envs.pythonProjects": [],
+    "python.analysis.fixAll": [],
+    "python.analysis.includeAliasesFromUserFiles": true,
+    "python.analysis.showOnlyDirectDependenciesInAutoImport": true
 }
\ No newline at end of file
diff --git a/docs/feeds.md b/docs/feeds.md
index 08e85f0..b8c7f69 100644
--- a/docs/feeds.md
+++ b/docs/feeds.md
@@ -1,106 +1,263 @@
-# TUI Feeds
+## Codebase Analysis Report: RAG Manager Ingestion Pipeline
 
-This guide explains how the terminal dashboard surfaces collection activity and status signals so new backends can plug in without duplicating UI logic.
+**Status:** Validated against current codebase implementation
+**Target:** Enhanced implementation guidance for efficient agent execution
 
-***
+This analysis has been validated against the actual codebase structure and provides implementation-specific details for executing recommended improvements. The codebase demonstrates solid architecture with clear separation of concerns between ingestion flows, storage adapters, and TUI components.
 
-## Activity Feed
+### Architecture Overview
+- **Storage Backends**: Weaviate, OpenWebUI, R2R with unified `BaseStorage` interface
+- **TUI Framework**: Textual-based with reactive components and async worker patterns
+- **Orchestration**: Prefect flows with retry logic and progress callbacks
+- **Configuration**: Pydantic-based settings with environment variable support
 
-- **Primary surface:** `#activity_feed` widget inside `DashboardScreen` (`ingest_pipeline/cli/tui/screens/dashboard.py`).
-- **Data source:** `self.collections`, populated by `refresh_collections()` after gathering payloads from Weaviate and OpenWebUI via `describe_collections()`.
-- **Selection logic:** `_generate_activity_text()` formats the three most recent `CollectionInfo` entries and appends an aggregate line when additional collections exist.
-- **Empty state:** Presents the call-to-action _“🚀 No collections found…”_ encouraging the user to launch an ingestion run.
-- **Icons:** `_get_content_type_icon()` maps collection names containing `web`, `doc`, or `repo` to 🌐/📖/📦 respectively, and falls back to 📄. Update this helper when introducing new naming conventions.
+### Validated Implementation Analysis
 
-### When it refreshes
+### 1. Bug Fixes & Potential Issues
 
-1. `refresh_collections()` loads data for each connected backend and caches it in `self.collections`.
-2. `_update_activity_feed()` is triggered from `update_metrics()` immediately after metrics cards recompute.
-3. The Static widget updates with a newline-delimited summary, keeping the dashboard reactive without rerendering the entire layout.
+These are areas where the code may not function as intended or could lead to errors.
 
-To surface a new backend, extend either `list_weaviate_collections()` or `list_openwebui_collections()` with the additional source (or introduce a new list helper) and ensure the resulting dictionaries match the `CollectionInfo` contract.
+*   <details>
+    <summary>
+    <b>HIGH PRIORITY: `R2RStorage.store_batch` inefficient looping (Lines 161-179)</b>
+    </summary>
 
-***
+    *   **File:** `ingest_pipeline/storage/r2r/storage.py:161-179`
+    *   **Issue:** CONFIRMED - Method loops through documents calling `_store_single_document` individually
+    *   **Impact:** ~5-10x performance degradation for batch operations
+    *   **Implementation:** Check R2R v3 API for bulk endpoints; current implementation uses `/v3/documents` per document
+    *   **Effort:** Medium (API research + refactor)
+    *   **Priority:** High - affects all R2R ingestion workflows
+    </details>
 
-## Status Ticker
+*   <details>
+    <summary>
+    <b>MEDIUM PRIORITY: Mixed HTTP client usage in `R2RStorage` (Lines 80, 99, 258)</b>
+    </summary>
 
-- **Widget:** `#status_text` Static component under the metrics card cluster.
-- **Lifecycle:** `refresh_collections()` pushes human-readable messages as each backend initializes, succeeds, or fails, ending with a ready state.
-- **Problem reporting:** Failures bubble into rich notifications via `self.notify` and remain visible in the ticker until the next refresh attempt.
-- **System health badge:** `_update_status_card()` converts backend counts into 🟢/🟡/🔴 badges so operators can judge connectivity at a glance.
+    *   **File:** `ingest_pipeline/storage/r2r/storage.py:80,99,258`
+    *   **Issue:** VALIDATED - Mixes `R2RAsyncClient` (line 80) with direct `httpx.AsyncClient` (lines 99, 258)
+    *   **Specific Methods:** `initialize()`, `_ensure_collection()`, `_attempt_document_creation()`
+    *   **Impact:** Inconsistent auth/header handling, connection pooling inefficiency
+    *   **Implementation:** Extend `R2RAsyncClient` or create adapter pattern for missing endpoints
+    *   **Test Coverage:** Check if affected methods have unit tests before refactoring
+    *   **Effort:** Medium (requires SDK analysis)
+    </details>
 
-When adding a backend integration, hook into the progress text updates inside `refresh_collections()` so the ticker narrates each stage consistently.
+*   <details>
+    <summary>
+    <b>MEDIUM PRIORITY: TUI blocking during storage init (Line 91)</b>
+    </summary>
 
-***
+    *   **File:** `ingest_pipeline/cli/tui/utils/runners.py:91`
+    *   **Issue:** CONFIRMED - `await storage_manager.initialize_all_backends()` blocks TUI startup
+    *   **Current Implementation:** 30s timeout per backend in `StorageManager.initialize_all_backends()`
+    *   **User Impact:** Frozen terminal for up to 90s if all backends timeout
+    *   **Solution:** Move to `CollectionOverviewScreen.on_mount()` as `@work` task
+    *   **Dependencies:** `dashboard.py:304` already has worker pattern for `refresh_collections`
+    *   **Implementation:** Use existing loading indicators and status updates (lines 308-312)
+    *   **Effort:** Low (pattern exists, needs relocation)
+    </details>
 
-## Notifications & Progress
+*   <details>
+    <summary>
+    <b>LOW PRIORITY: Weak URL validation in `IngestionScreen` (Lines 240-260)</b>
+    </summary>
 
-- **Toast notifications:** All feed-relevant exceptions use `self.notify` with severity hints, keeping the activity feed focused on successful runs.
-- **Ingestion progress:** `IngestionScreen.perform_ingestion()` (same module) drives the animated progress bar and sends celebratory/failure messages that complement the dashboard feed once control returns to the main screen.
+    *   **File:** `ingest_pipeline/cli/tui/screens/ingestion.py:240-260`
+    *   **Issue:** CONFIRMED - Method accepts `foo/bar` as valid (line 258)
+    *   **Security Risk:** Medium - malicious URLs could be passed to ingestors
+    *   **Current Logic:** Basic prefix checks only (http/https/file://)
+    *   **Enhancement:** Add `pathlib.Path.exists()` for file:// paths, `.git` directory check for repos
+    *   **Dependencies:** Import `pathlib` and add proper regex validation
+    *   **Alternative:** Use `validators` library (not currently imported)
+    *   **Effort:** Low (validation logic only)
+    </details>
 
-***
+### 2. Code Redundancy & Refactoring Opportunities
 
-## Extending the Feed System
+These suggestions aim to make the code more concise, maintainable, and reusable (D.R.Y. - Don't Repeat Yourself).
 
-1. Return a fully populated `CollectionInfo` (name, type, backend label, status, last_updated, size_mb, count).
-2. Call `update_metrics()` after mutating `self.collections` so both metrics cards and the activity feed stay in sync.
-3. Adjust `_get_content_type_icon()` or `_format_collection_item()` if the new source warrants distinct labeling.
-4. Update end-to-end tests or manual runbooks to verify the ticker, notifications, and activity feed stay coherent after integration.
+*   <details>
+    <summary>
+    <b>HIGH IMPACT: Redundant collection logic in dashboard (Lines 356-424)</b>
+    </summary>
 
-***
+    *   **File:** `ingest_pipeline/cli/tui/screens/dashboard.py:356-424`
+    *   **Issue:** CONFIRMED - `list_weaviate_collections()` and `list_openwebui_collections()` duplicate `StorageManager.get_all_collections()`
+    *   **Code Duplication:** ~70 lines of redundant collection listing logic
+    *   **Architecture Violation:** UI layer coupled to specific storage implementations
+    *   **Current Usage:** `refresh_collections()` calls `get_all_collections()` (line 327), making methods obsolete
+    *   **Action:** DELETE methods `list_weaviate_collections` and `list_openwebui_collections`
+    *   **Impact:** Code reduction ~70 lines, improved maintainability
+    *   **Risk:** Low - methods appear unused in current flow
+    *   **Effort:** Low (deletion only)
+    </details>
 
-## Implementation Status (September 17, 2025)
+*   <details>
+    <summary>
+    <b>MEDIUM IMPACT: Repetitive backend init pattern (Lines 255-291)</b>
+    </summary>
 
-| Component | Responsibility | Location |
-| --- | --- | --- |
-| Activity feed rendering | `_update_activity_feed`, `_generate_activity_text`, `_format_collection_item` | `ingest_pipeline/cli/tui/screens/dashboard.py`
-| Backend loaders | `list_weaviate_collections`, `list_openwebui_collections` | `ingest_pipeline/cli/tui/screens/dashboard.py`
-| Status ticker & health badge | `_update_status_card`, `refresh_collections` progress updates | `ingest_pipeline/cli/tui/screens/dashboard.py`
-| Ingestion progress hand-off | `perform_ingestion` success/error notifications | `ingest_pipeline/cli/tui/screens/ingestion.py`
+    *   **File:** `ingest_pipeline/cli/tui/utils/storage_manager.py:255-291`
+    *   **Issue:** CONFIRMED - Pattern repeated 3x for each backend type
+    *   **Code Structure:** Check settings → Create config → Add task (12 lines × 3 backends)
+    *   **Current Backends:** Weaviate (258-267), OpenWebUI (270-279), R2R (282-291)
+    *   **Refactor Pattern:** Create `BackendConfig` dataclass with `(backend_type, endpoint_setting, api_key_setting, storage_class)`
+    *   **Implementation:** Loop over config list, reducing ~36 lines to ~15 lines
+    *   **Extensibility:** Adding new backend becomes one-line config addition
+    *   **Testing:** Ensure `asyncio.gather()` behavior unchanged (line 296)
+    *   **Effort:** Medium (requires dataclass design + testing)
+    </details>
 
-***
+*   <details>
+    <summary>
+    <b>MEDIUM IMPACT: Repeated Prefect block loading pattern (Lines 266-311)</b>
+    </summary>
 
-## Multi-Storage Ingestion Refactor Plan
+    *   **File:** `ingest_pipeline/flows/ingestion.py:266-311`
+    *   **Issue:** CONFIRMED - Pattern in `_create_ingestor()` and `_create_storage()` methods
+    *   **Duplication:** `Block.aload()` + fallback logic repeated 4x across both methods
+    *   **Variable Resolution:** Batch size logic (lines 244-255) also needs abstraction
+    *   **Helper Functions Needed:**
+      - `load_block_with_fallback(block_slug: str, default_config: T) -> T`
+      - `resolve_prefect_variable(var_name: str, default: T, type_cast: Type[T]) -> T`
+    *   **Impact:** Cleaner flow logic, better error handling, type safety
+    *   **Lines Reduced:** ~20 lines of repetitive code
+    *   **Effort:** Medium (requires generic typing)
+    </details>
 
-### 0. Guardrails and Baseline
-- Activate the virtual environment (`source .venv/bin/activate`) before running any tooling.
-- Capture current lint, type, and test status (`uv run basedpyright`, `uv run ruff check`, `uv run pytest`) to compare after the refactor.
-- Record the existing ingestion modal behaviour (screenshots or a short `textual run --dev ingest_pipeline/cli/tui` demo) to verify UX parity later.
+### 3. User Experience (UX) Enhancements
 
-### 1. Storage Layer Enhancements
-- Graduate `MultiStorageAdapter` into `ingest_pipeline/storage/` so it can be reused outside the TUI package.
-- Extend `BaseStorage` with a descriptive `display_name` property that downstream UIs can show without hard-coding labels.
-- Harden the adapter: aggregate per-backend failures, short-circuit `close()` safely, and surface a structured result containing `success_ids` and `failed_targets`.
-- Add `StorageManager.build_multi_adapter(backends: Sequence[StorageBackend])` that returns an initialised adapter (invokes `initialize()` on each child) and memoises singletons for reuse inside the session.
+These are suggestions to make your TUI more powerful, intuitive, and enjoyable for the user.
 
-### 2. Application Wiring
-- Refactor `CollectionManagementApp` to accept a `StorageManager` plus optional cached clients, removing direct constructor parameters for Weaviate/OpenWebUI.
-- Update all screens (`dashboard.py`, `documents.py`, `search.py`, dialogs) to pull storages through the shared manager instead of owning bespoke references.
-- Expose a capability flag (e.g., `StorageCapabilities.REPLICATION`) so the dashboard can badge backends that support multi-target ingestion.
+*   <details>
+    <summary>
+    <b>HIGH IMPACT: Document content viewer modal (Add to documents.py)</b>
+    </summary>
 
-### 3. Ingestion Modal UX
-- Replace the single-backend select with a checkbox group generated from `StorageManager.get_available_backends()`; preserve keyboard shortcuts (`1`, `2`, `3`, plus `ctrl+shift+<n>` for toggling if feasible).
-- Default the selection to the collection’s current backend but allow "Select All"/"Clear" convenience buttons.
-- Persist the latest selection inside a lightweight config file (for example `~/.config/rag-manager/tui.json`) to improve repeated runs.
+    *   **Target File:** `ingest_pipeline/cli/tui/screens/documents.py`
+    *   **Current State:** READY - `DocumentManagementScreen` has table selection (line 212)
+    *   **Implementation:**
+      - Add `Binding("v", "view_document", "View")` to BINDINGS (line 27)
+      - Create `DocumentContentModal(ModalScreen)` with `ScrollableContainer` + `Markdown`
+      - Use existing `get_current_document()` method (line 212)
+      - Fetch full content via `storage.retrieve(document_id)`
+    *   **Dependencies:** Import `ModalScreen`, `ScrollableContainer`, `Markdown` from textual
+    *   **User Value:** HIGH - essential for content inspection workflow
+    *   **Effort:** Low-Medium (~50 lines of modal code)
+    *   **Pattern:** Follow existing modal patterns in codebase
+    </details>
 
-### 4. Flow Integration
-- Update `IngestionScreen.perform_ingestion()` to build the multi-adapter, pass it to `ingest_documents_task`, and capture per-backend success/failure counts for feed reporting.
-- Teach `ingest_pipeline/flows/ingestion.py` helpers to recognise the adapter (inspect for `fanout_targets`) and log progress per backend, while keeping Firecrawl→R2R flow single-target until replication lands there.
-- Ensure partial failures propagate as `IngestionStatus.PARTIAL` with an error message enumerating the failing targets.
+*   <details>
+    <summary>
+    <b>HIGH IMPACT: Analytics tab visualization (Lines 164-189)</b>
+    </summary>
 
-### 5. Feeds, Ticker, and Notifications
-- Extend `_generate_activity_text()` to append the backend list (e.g., `→ weaviate + open_webui`) when a multi-target run finishes.
-- Add per-backend status lines to the progress ticker so operators know which replication stage is executing.
-- Emit granular toast notifications: success summary plus warning toasts for any backend that failed to store documents.
+    *   **Target File:** `ingest_pipeline/cli/tui/screens/dashboard.py:164-189`
+    *   **Current State:** PLACEHOLDER - Static widgets with dummy content
+    *   **Data Source:** Use existing `self.collections` (line 65) populated by `refresh_collections()`
+    *   **Implementation Options:**
+      1. **Simple Text Chart:** ASCII bar chart using existing collections data
+      2. **textual-plotext:** Add dependency + bar chart widget
+      3. **Custom Widget:** Simple bar visualization with Static widgets
+    *   **Metrics to Show:**
+      - Documents per collection (data available)
+      - Storage usage per backend (calculated in `_calculate_metrics()`)
+      - Ingestion timeline (requires timestamp tracking)
+    *   **Effort:** Low-Medium (depends on visualization complexity)
+    *   **Dependencies:** Consider `textual-plotext` or pure ASCII approach
+    </details>
 
-### 6. Validation
-- Add unit coverage for `MultiStorageAdapter` (full success, partial failure, close semantics) under `ingest_pipeline/tests/storage/`.
-- Create a focused TUI smoke test that opens the ingestion modal, toggles multiple checkboxes, and asserts the resulting progress copy.
-- Re-run `uv run basedpyright`, `uv run ruff check`, and the targeted pytest suite before and after changes; address new diagnostics immediately.
-- Optionally script a headless `textual run` that simulates ingestion across two mock storages to guard against regressions.
+*   <details>
+    <summary>
+    <b>MEDIUM IMPACT: Global search implementation (Button exists, needs screen)</b>
+    </summary>
 
-### 7. Documentation and Rollout
-- Update this document and `README.md` with refreshed screenshots/GIFs demonstrating multi-backend ingestion.
-- Draft release notes covering required configuration (API keys for every backend) and outline rollback instructions (git tag + revert steps).
-- Brief support/playbook owners on interpreting the enriched feed/ticker signals so incidents can be triaged quickly.
+    *   **Target File:** `ingest_pipeline/cli/tui/screens/dashboard.py`
+    *   **Current State:** READY - "Search All" button exists (line 122), handler stubbed
+    *   **Backend Support:** `StorageManager.search_across_backends()` method exists (line 413-441)
+    *   **Implementation:**
+      - Create `GlobalSearchScreen(ModalScreen)` with search input + results table
+      - Use existing `search_across_backends()` method for data
+      - Add "Backend" column to results table showing data source
+      - Handle async search with loading indicators
+    *   **Current Limitation:** Search only works for Weaviate (line 563), need to extend
+    *   **Data Flow:** Input → `storage_manager.search_across_backends()` → Results display
+    *   **Effort:** Medium (~100 lines for new screen + search logic)
+    </details>
 
+*   <details>
+    <summary>
+    <b>MEDIUM IMPACT: R2R advanced features integration (Widgets ready)</b>
+    </summary>
+
+    *   **Target File:** `ingest_pipeline/cli/tui/screens/documents.py`
+    *   **Available Widgets:** CONFIRMED - `ChunkViewer`, `EntityGraph`, `CollectionStats`, `DocumentOverview` in `r2r_widgets.py`
+    *   **Current Implementation:** Basic document table only, R2R-specific features unused
+    *   **Integration Points:**
+      - Add "R2R Details" button when `collection["type"] == "r2r"` (conditional UI)
+      - Create `R2RDocumentDetailsScreen` using existing widgets
+      - Use `StorageManager.get_r2r_storage()` method (exists at line 442)
+    *   **R2R Methods Available:**
+      - `get_document_chunks()`, `extract_entities()`, `get_document_overview()`
+    *   **User Value:** Medium-High for R2R users, showcases advanced features
+    *   **Effort:** Low-Medium (widgets exist, need screen integration)
+    </details>
+
+*   <details>
+    <summary>
+    <b>LOW IMPACT: Create collection dialog (Backend methods exist)</b>
+    </summary>
+
+    *   **Target File:** `ingest_pipeline/cli/tui/screens/dashboard.py`
+    *   **Backend Support:** CONFIRMED - `create_collection()` method exists for R2R storage (line 690)
+    *   **Current State:** No "Create Collection" button in existing UI
+    *   **Implementation:**
+      - Add "New Collection" button to dashboard action buttons
+      - Create `CreateCollectionModal` with name input + backend checkboxes
+      - Iterate over `storage_manager.get_available_backends()` for backend selection
+      - Call `storage.create_collection()` on selected backends
+    *   **Backend Compatibility:** Check which storage backends support collection creation
+    *   **User Value:** Low-Medium (manual workflow, not critical)
+    *   **Effort:** Low-Medium (~75 lines for modal + integration)
+    </details>
+
+## Implementation Priority Matrix
+
+### Quick Wins (High Impact, Low Effort)
+1. **Delete redundant collection methods** (dashboard.py:356-424) - 5 min
+2. **Fix TUI startup blocking** (runners.py:91) - 15 min
+3. **Document content viewer modal** (documents.py) - 30 min
+
+### High Impact Fixes (Medium Effort)
+1. **R2R batch operation optimization** (storage.py:161-179) - Research R2R v3 API + implementation
+2. **Analytics tab visualization** (dashboard.py:164-189) - Choose visualization approach + implement
+3. **Backend initialization refactoring** (storage_manager.py:255-291) - Dataclass design + testing
+
+### Technical Debt (Long-term)
+1. **R2R client consistency** (storage.py) - SDK analysis + refactoring
+2. **Prefect block loading helpers** (ingestion.py:266-311) - Generic typing + testing
+3. **URL validation enhancement** (ingestion.py:240-260) - Security + validation logic
+
+### Feature Enhancements (User Value)
+1. **Global search implementation** - Medium effort, requires search backend extension
+2. **R2R advanced features integration** - Showcase existing widget capabilities
+3. **Create collection dialog** - Nice-to-have administrative feature
+
+## Agent Execution Notes
+
+**Context Efficiency Tips:**
+- Focus on one priority tier at a time
+- Read specific file ranges mentioned in line numbers
+- Use existing patterns (worker decorators, modal screens, async methods)
+- Test changes incrementally, especially async operations
+- Verify import dependencies before implementation
+
+**Architecture Constraints:**
+- Maintain async/await patterns throughout
+- Follow Textual reactive widget patterns
+- Preserve Prefect flow structure for orchestration
+- Keep storage backend abstraction intact
+
+The codebase demonstrates excellent architectural foundations - these enhancements build upon existing strengths rather than requiring structural changes.
\ No newline at end of file
diff --git a/ingest_pipeline/cli/tui/__pycache__/styles.cpython-312.pyc b/ingest_pipeline/cli/tui/__pycache__/styles.cpython-312.pyc
index 45304920578ed54eae4bc51faf28b88ede5cb054..940720f4eccf18dabbdec07b05a9b22cc32bcfe4 100644
GIT binary patch
delta 4821
zcmZ`+Yiu0V6`q-$eRyA9$B+0Gd;N%$&BNK3ckRS^I3WcG<b>F$jY(^dcV=Rz8?SX|
zOk(4BP2vU@19Ey>h}wcu+8>xikkkaI)E}`_@dweyBD63C6(RV6)K*4uMa8e4b7yB0
zn{-xt=A3iyJ@?%2o_o%nm%bLBUJ?B7`Fw5;p8kFB5B9up(O=GAySQn4R_0}U+Ih;=
z>*6`Zr4&>^mtMEPJ;=$9X-;-3jw?1C23il(x<Ff?h<UA75t!Z$de0TX?0dz0alJm)
z=7lz&)z<50IzQ+NuN3A6^a7(4DqdPtS>nIKo5OpHl%kUxX>D<3Rw|YQidQaDN>ou^
zH!b#-0$-+h(Op%Li$Sv<G+y9KfG-E$2Ye~;759uR1G!ROuecS@xRc||7P(w?$Q961
z#T=^y$ExzqR?F4$26=CdTq_6Vx?kISH!vpzxgG}8<oE{QYjb=f@WC9v5%{{X@=z0f
zjX#}r9U&P#lggw+ykYAY8A;_pVy_$y+?{d|U*r_7mzTL-LFRjHvMAfYkT@oU?1l#h
zT6V^FSX@xekf1a&q6PIqNe^nHBO@822M=_22c=;-NEDSQ4sEcxE5%dyv$gesqo~ma
zp}T_Pn!Dz?dEO8;C9P_RevtZXoqG%?8>tPB7vD2&b50q6ewrP~6!)3Sa|akMBp42&
z=%Zw~D`cnFgzdYCAJhaRj}#*DA#qs*B@G*=xsS!R6;ZHz&2HF(ZWLxqND=m3hol%u
z2{wExgeuqCEW=hLrBt%jJJ@7p^m#|c!Yj6FA+XjA{j<HYVvSotG=Zds@{XrX6G1Ss
zD3Ab^+*|0R^Q~+hw2wO*!csUD36pwLinK&pqY=`OlhkM|+C~~pDcTZki$%#skiK;`
zsO%w4rlcekS&flRrj%-vBXS$r3=#<efoURYLRALH7E_9~wq^%ZnQS%1Xsk66OOS0K
zfn_<`))tMD?WUx*wnXA>q}h~OTBU@lk{#x_cs!nJNsur|B!VPr_KGAT17IO$O3_F(
z5tT{Ylw#pnA|?|zB0SGCl<wUD`cOfVe}GOEe8v|7R39>!$WG{NK?DnFRV51|HKNAU
zID?2G!<GuDwK8Ntibvy8i-`<Ku*_64u?m@RTcS;tEM&s1iEv7?fQd-iq#8>yWMFig
zlt_ld3>lE*NHiW*88Q|i2)hzyfItUTPAZZ3U1S&_pjRYCQKJkHbLj_gd8=c{C^(_$
zed!?@_f~uGfRlqr5R?7%b-$O+d!NsTP#7NzpNND%3m<?UepU#@*u#J_F~#s<Q3GzJ
z*s~g&uq45D=b|Q&NToo^1x+}dRaKZ4qXrkNO440yR25<)z6zTJd-B*o_(J!5)G%xq
zBw#Bp<M01tQ-s(I4$&6>HqW{5VDoYw7daA%BpEJbA9llIMLLjJM@j}j2CTqQ!w_33
z7C2-V_QK;t+L7ds64{Gl4v=J9Dts4^m^#qbf_VG@dhEt-c!bCvBzSySkdXbz;fX=a
zlC6<M;(j39f9<p(5L17H2Fzdpt}EoeUuHABnl9->sZ)wRn32s>_5coi5J@MJhmouf
zI?{?dBpvjRfiq^}YF*e_)F>QgX|c*`C(Kwiip=5$<e1qS<j}U^?1Q3kO3^|B@uKoD
z5Dm*yFi3p#_2NeVpHR~WWQzM}a|`{fxTiAdo)MojbGKn<;|Z3Bu9QH(ezJrPl<cfH
z3bJMMF|?4kd84GM^nKLevY?o3sGku(bXCHsSuU9@>jovk!Nh}oSakwNE|l)%m*`??
zkS|>Ly!749>@jFH#FLq!Vb<HQKOv<@6~hj-P$2}<wt0Z+k;C+AMhs><bBkF%Y(x=r
zp1Hj&fG}*>@i8L<PmURrm^aO6Yvuss-0BSHh?G`zUAeo${r%hc4;M21`^t}FVG4Qg
zxB0Ak5w=%7X!!d`f=F;_qy<Sok~O>Eg*qgQ)HBw#o>e{+4L93}K79-T2+)zScXu$8
z{n+O0d91S!?gt^BNFZCV0&C8TJ@->(d>iERpN*e5$l_@A#6}68XXy!PC@l@7m0Z}6
z6EO0S2qrOlrnoOWg+DKt-Fr*K{oM1U(#f(S+s`%TSb9i}5~2+2rZF-ECJv)5f6i9<
z-#krAo~B!36IlD_ljDytYYd<JSu+91Z3p==80kT4co{&?z}mJY&$bUd&9}s6FgP++
zLEoGB*ZR9I<^c=Yh(!N#wsHerSq#%vP3wbuSI*T8=#Npy<Us)Jk;z)#LDQ45b}gXe
z4T(JyobIrA>wZbL>IIf=f|L0P!Ma%U9Q9?_^F?&=CuKB~^`yix_%(1k!pfdTsI6yh
zGTaZ-&a>i#coLVj=8^3awqJ2C3D%XG=Z<l*c-A&)8xzg<Y5p{K#&(Q5&4(QH@7b*d
zHi!y#YooPOo3<9Pa4?*Mk|yaoG2BDi&@d#a;gmvfHHK4DAZ6)<_^CEkmmL8eizqUT
zt-L}`!&^fTg7~ltps^0_oar$WxjsG92O=4VE(5qbW57&t%c95L{)vD6CHDvZh8f!z
zo^^AvOZMBIn%`}CwfoJ6+x3Z0yv1_|E|p%k-S#$qQCK#oUFy7DUfA?ep!h}4Mb9sM
z%Qh~sY1zp&B>%hOrkzi1$>QDmTt}dzlv^w<*w5J(Ysx!z*%o)%fyX`1Kh7L?X9k!x
zw{eebQ$)qiz8?feMOlEa68p5h*C9I;rz|QikezU6FJQbNyMTAgyRku#3qbHdgBQNH
zT#8R|Rlp=@$keEUC7T?KaKi{ctvL6Xhrx@PHJ4bQJ9l8uqacPv!kY5w-td{RKRBf6
z88T)iUhI@lOTd#J>OWt#c@%L+bReV0lQZJ8u1|KfzA-sJd8>I(E*E2Gi9UM%KM8gw
zCP6kFuy4w+Y)*~)2d9M93`{9305ltLY}@I?^mcxXzBYXT6868Rck@X+-1p=>R)JVS
zdI}q`NLgN=0zU6G9k`I>&(mLCI1VT6n+u<B#e~B$g<&5WmX$MxEv*a_G!n8icMJ!^
zLL;ZBI1}Q1w0UMbKTD6#90gb2m}%$D+v-NNgN4EHr82`hku<$;Xjsj_qA*<<f$yX`
ztbrjX%PY(Q@<TMi{Ha4OZ_&a92N=A57ZsHKC+Nv%w(^v|@Ju?(HnZ@4<-u_GC};Fh
zDGi@u<`)#J5^Tp=ZD6pS$9ZSbtSAqqbfTg>hh%krBonA(1o!?7Ncas_^U&Au5w`cz
zp;xPxs^i!6rRrVF94Kz;cko5$W)qvPiPyTX7tHT?=YgBWH&Zvu|IoFx<<PB-hn9j5
zuW(+w+x&u?SorH~YQtVO>*}eEbyzpx^K&FKtPMS(^rbY7ybKOpMNeG7;OXyhdPP#W
zaAy81fq#5q;ObS;f%%&pr|sAGCe2FRjEWsd!bl=WSWRX{9jiE$H^kg3Z}ge#wf4)P
zAPcWwmjwu*;x~UAIt&UpKv*;HiN}7_@&xlje)vD$th2uYir-WFjm<E+`NlO5%FKOo
znSOO+S3N5bWoClAXOS!f$*a)$9s0eucDt}lhw4cQoqcP2*6`@&-Zo<<WO>z*891rH
z23|z-2#V=i5IMZ+neMXN0=h{0k;q6`Ft9_)Ha~wn%s9n5#d0m%e535>!R{lp{O#f_
z?f|)rgsliYT@y3ky4p`=<k7UUhr9u;Jp8q8pvyL%=Rf9t^d(pKDOdU_SM?=Vwd~;h
zMRR38eSFHj;;{4Hxy>sayjB7ZJ~$_?aPV4Q#|fTqgj&9MnXBdL+}ke%eSCW^^p-i`
XZ-&_G){&k&D1H;9``$SwB69x&C-fXf

delta 4307
zcmZ`+eQXrR72n<4y*uBRKkv?;V1xNM!1O-sJ6{3;Od6mBH!Y9^lX6|(?BcV`na-_4
zOpMPYP}>Dkl0k~26hYKh5m4GFPJn*=0jRAir5~VzNLEHlt5&MoKkCF(tx#0;y;<L3
zBRVI)eecbiH#5I^@6CAho^<*%$@h`h>k^>N-1%+KN2gx*Rg1%~FKg+RgiQibjtIoA
z$ro&BAP8L!P2ze7=$#iNOMAik2whIzR|0*mLSI)2*SSIGDe7F3pt&>$n_gbUe(`Om
zz00F{dh3{4Rhw6R#H%@oPb<}BQhG%0Dg(Y;bJV~bx<txAQvn(W@a4c)0`COA0{E&q
zBP&7nlPWD>>4;yqlK|*~d^JH>O?7cK)ue{hk~&gP8c1@%_mr+0KD|U1!hqUYz7hDk
zS-uJQ`dNMv@C}3h&|)?v9*}JtvV+ViA7f{2E$m%6<TxkHAULeXw#7{yz;WVaf0q~8
z{al=^P}-!89^}19d`L=xn6{ij&C*m#&1U-z)yVW`bEy=q!hSw9fLwKfl(X+RMlGM!
zEa<%EH0@L~256Sub>7V*d<Pwi!)iDk3Da6jinK-AqY+v+E9uc#G)e0%DcTlI#-g+V
zr2CG=I&XA=C24Vu=rOv`lF~^MAxYW@5^Vwk(?s;Ru65HzmK1Am&v)yDF1EyItUVr!
z(`JysGl?dX(I{PFNqT!*q%}#GT2foP8rOBY%o^9)+L~^Q)8!!15Rw&^RU{ti1`jJO
zDH@5!qlB)qq*yo>j}cmhP@NMku;u{Be(y?%31)YHD*D-<yd5m$VH_$Ng8>DYU^DHy
zT7XH9=rO&O!^F|y+Xdv>IXWP<MqAZ33muSPtLa319y;M<JW137I^p(sIIR}IiKzL6
z9!qd^V02QAC&FQl4oD;tZH?+2odPHby%y%6fPqdDTBP*>Ivf<xYpSN{Q4Wd~KWlJ%
zbASNREZM6WslE*RnYZ5kEcQQv1aX-vhEEt<0hfr1zXC1*JNyda6XT5oWMPS+!y^Wk
zljdzcCSg^Dqn?eJcs!j3X*OWO;k>THv=}kCNnKSRV4~{~7p?O!iSt&(1VR_gixI;y
z;ZT6DR)W9(k4ZUV(vx97FJ0vxn1@LxTVM7@5f>7PL=qeqnnW{9Df$?aLOKxuq`MF>
zdKh9V%>#zEq7|kRZ9~$C1k;GNBbfyxkxYjl020%?lWmB{^I#E2GfW?vK!T~mgM&Vf
z9A*n*mS~T}<BtO2(R*j-%47Lc=)ejB;5tJt`lu@9$zg3u@6(K)eqv?VS{%3@Ne7ZA
zk<1S^8b%!w+<vYf$PwWaIrgbiJ}uQNu8E<~1-82)W!1Cr<kgC1=^0)=%L)T2pQRkd
z^++m^@cAl{!%0m?%IMMdX}OSO$~mo1r<*~WlYlff(g2J3n|+s2lL9g#eB7{tY5pBm
z)vhu5gooEyQ{fJ1g#FIHqh>3Zg(SKSKJ=?NuITBpz*6xlQv;PyM+O4J)lZ`dHy62i
zP6P!`SrU9q{3Uxb*a(JSjMhvJ2QO~PZ--7(?(NTH`504qQSBShOl4sIevMKr-Bu!D
z*|uVXXA@RD>!^86#7MJJoX2`2ii?n78d(v78DzyK)=n$xmI`)jSL{8tN(``HsjI}_
zOn$DeuYLh<nULpEr*2(k{46@r)7Oyjs|fc(Taa`idFa?Tp$^Fh?6rfPL4J*)Xu3Gg
zDPs_J9APsDfBhxy5`CDC9Xq$AHg4Y@66tP`3s?ec&5M?8>~Alx0!*Lyu!gN3>MY~2
zGG}sje5kfg1;e#6c)&Ow5&q&XJymjS-3_@Gs@%09ZOb>%C7#+t%Qkr#NDok|WeqE&
zXd28q&==m<=&SmUd+AO0(i`$p@Ya9mpr3o=aLirDe-8x}4TfxDwZpZdf3j`ZE=C_r
zT-<fY#y4v^W~Vi6>0B;ngOQCqcK79jN(Q8-*?9iTu<<|S7mB^?pZS<X<LqiM$j%Md
zNut2ne*`OiL(&C|L1>~dsIWaF!KBY{TN*(a5{LvA=pGtc7_&U@vlZS-w0ubD_2NT~
zpwXbRSTGO(-kKra4%vuIls@Mnc}VWXM0}_b`;hHz;q;uv?1D$;A=|KRP_e!T!~?=h
zwq3#jG2~$PM^@Ija>ihvmg~_p!?Zydm=3Dx6clXr;bko@9s{PMN6o2*L1`aMXe#MG
zO{J!?U!^(CbmTNBQP7uVBZr&vy<owyr9EgXYSe&lP5}bYBDkooQ1|ce8?+8PW%Q>&
zqz9m5C!YD6z>EmfvR7F%<qJ-@{^(mgW}9+XoQzF)Zn>9y>?!?j=XmEGPvcEb<1Npk
zd2;-0<!#TBDR0%u?GsCGc^juZl_xh&_|MvIdzvk6=$5znQ*g0$eCvsA(~96*@}GNl
z*8a+hd^61Z$_7t|L%3F2gEUkR^tz*@BWk-|R^8EJyWXMzkHJ}NxG`)qI*>O7P3RJd
z&?OPE%SPP9rpZJ)2<ZanCc%?iIihqa@Z`4>86Md(alrf5$$5z^bAnJZE0h550^Y4T
zG><OLzRz8t^|A%8?kwRjM_@{J(;r}Oyt*;}6%ax)<sCdfv3{6dEAx9YIisHr7RoCc
z70WB|6wA!Pzz!_u+Ye-nbdN??r&5`0#z>`l@l3G#Kn<@9jLFBHQwx@z$-b4n(a<s`
z-*!TNL#IS{vuBU|E6!8wWl)%QI8-f5tQFzmLelZ#j%9{N$DD*ae6&T(vY#B?2uVA0
zbgh^`kmuAv40h`h8b+=hNMSR3fiG@`?Hx^sFR?SDFF@9QG5Y6~Se1A=F_lb~XfK(z
zJ}pbpNl4+#G3^|p9No)G#zRn|W8*F22vf(u4omr9e2v)j;EHI1VWv0TpEanOGXNjG
zA2zj>l^+Xq>_V52Jcaq_bI9@O=Q}9CfCEg?m;*xQSVSCSZy)Qk4%7FjyTP>gclT;(
zgCCg%5Wf#NEF(DO82Xh-25c}m=?NrriX@7I1+o_p7Y_s<2%A5XC1v%*Q)f$eytQpw
z0RFulGx%XYI36!M`}{k;dxA%CS^pmmPKqbe4ePk$`QFV6eAht@*$@9yWnR=$P+RHS
zFvmMMnG+by?hOu)47L1fMb+fx^S32&=j4ftKay8-{P+WzqsA}gI$SNkfE$qG*E4_9
zHL`W@uPcR{3$ZNRT<pX57b>Sgv3K&5_ld->t?!36g96fH6FMlS2fsyOINlJ&;jT+f
z${A3+%fgqI^CwbTVB%O6qnF-vV+Y?0J<X~vKMvvY%;kFJhoHU4zIA!6lV9o!XeqmN
zx#c-)B7Sj)aU7qVU+erz;#c?{?BFNJGv}Kq7Gu_mCcKE~Ye+DQ=pfs5rG6XYNpY8y
zF9}!h&>`P<uG!a52Kuxo=y~WB;V%~hI&Bk0@e^UsUxlW-g8!}%fbutW<;S(9;+l!4
ZrUm%CSHeG6$P7yVZf56yx=Y5L{SOsxreOd8

diff --git a/ingest_pipeline/cli/tui/screens/__pycache__/dashboard.cpython-312.pyc b/ingest_pipeline/cli/tui/screens/__pycache__/dashboard.cpython-312.pyc
index 086f416443f48e7f449f5769a7501d04a13d6922..80b871055a5fa7963c028a4131526d49927417ad 100644
GIT binary patch
delta 2677
zcmZvedr(y86~OnqyX^8@6mfaOD#)@dyC_eQDiA@`=!z__@?Q2{U=?@a-s=k`LhD#;
znl|m3>BOXs8WSI>0h$|~Om$Lm63wHwP-?YXJEckUN7I?e$aHFx8SOcD#Tuvk$M1ai
zeCM3+eCK@kyL;y-_x3$z{3I$WT!X(a8*cP|)cs52gq9sqeyufe2`zllVO?`F-@+H8
zOhLICWh&nSUxwIO3nc5;A8O$@9M=7U{PEXpMVo50$>ui-M&3SX&}jI4-rlX_H=)+X
z=PzixIes&0a?t)+ly;O`P&!a<MVYJm=L>Pc80har?Mj^8hH@3k8kBi_O98(f2l=R|
zMOlE-g|ZN39m*n<^(c!`HlSS1Hwq;?WcYFA5=$_xCe)Vl-xf+9rP++n-x}5IW6f(_
z8f$AH9x77el~F^siJb=}<pA6(F>%8caI)8wJY0BCv%?tN`I8*B$_&1rn#%210`C2Z
zkeC_~r&gGZ_H!~8CHRx$;ER$}7)}jianQOVlS9RLZyJ=@4KR@!#ln^MkSr2@la>Id
zgjg6aOVI~(U4DNbJWQ)*$DrE0$~PMk{iC%<*G@&4Pt=`hKiNLDqV$UHdgx^6RC&#v
z^vo0TElcUNrSz7icG^-qW2u`-uOF?v8EO7|dggiE*}Czzb8RzOrI+ijWL$SlI%d{x
z|AVV>s;Tu>Q|EM3=ZwoeW$Btp_oyyng9b*Vc;$WbF^=7W_Vf?+=Wr_?4kpa8N_ob|
zEQX#X4q-Nn^(e$skes=SeXck&3%Hc?sBv2LVm8fK2}cM^3FB})%fu$&V%7@wI^4-x
z#r~-nt<#MC9A>l2*l{r1tZT-}GLrBHVFlqd!WtsFXncmyj|fD$J+gO?SKi+t3;Sg8
zP57>@n*Ce(#CC~eufq2n6Ij>Pxf|JAFp}HGF2Y}P)7S-gm|MtcnNqZ}Sj)!1m!FFB
zFXZ!!UZc1#5k?4?ffb~(NiY}muuJHa24@OPY>Dz-!A}^w0^5uJgtQf>=&qqPj5H=e
zPqB$vmFJ4j>e*GWtgC1BFtl!rSs|w^n~g(bSyPDkG8tbl%TByZYosFrQM>zjw=8r>
zvRmFQiElte`L9@ka;-eTDcYL%IsGJ=egHRW<7?l-;chx;bI0MZd8>Dyz>8BfeT61M
z)rlXxXl@j`#A(umsT%mHxzg{E#NR)mI&EI>=LPX9{B}bkRJrol4D54tnLb1lNslnA
zzhHl7Va`>=yo#mH&-7p6<fGFtQNNC@3Fzeg{erj!)!22l*Nbo*Y~Cw43TS%-IS|Tw
zC3jb!z%R7%D-Bp0pJ$*bjoUcx3k~R+v$%N;IGQuo=oki2Td|SC>Vl2`4+RSo{d+sS
zK3>=-QYMlPL8%5ay^oDbg*Thy*m31*^AKb2DCMpAevN^%t!D9kHGtRGBS^B>?-Qe7
zye%p2Q`B0u>JouaN$3+iGFCMT{?=B_-c_va&y)Lwj*jSP%F2jvS`FfT4WxJ4@=T;#
zOo$<<u^y$n1Qmg3N%o8G9-*Vl?b#{#c+mvIog3Mt@=@ozy0izBkVdVYxE05ulW-N`
zv_^>!;e-%(C=h|=d+eS_9-)m@6%Csz>Z$_a+iI$u9gS7b)NcxCYx8Qw>l9#wFoRgA
z991e1?eX`~=5Xg7YRhh*_Nn^CVa|gE>mM6#+XMDYBNTQga=&BB_U=D(>;c%lu12bb
zQyil;SRm3RxJ6H|%OeVcPpyzO6bpn&P(8%egmiRxqEK{P)Ga@%yhzm&)3N9YFz0n}
zcbQ_|(Mpvc+L=^AMHhFIi@GkJGqsfl-s|r3_ef&qH-kUX(O}$6HSWEg4*dhPlq$i|
zo&*(rA4D5vcUPCdcX<3hS@6lg{0We;YxOb%r_s#E<ATGQ*{qy#<2mCyLo-=bqsH52
z+o<toXbSA=YlpzD<@#(|ItMsk)3Qi(lK#JweZk2KpZS(9I6d&y85g6Im`gz#a5<=G
zGQmFv_QPHO%kflQ5vMiIbB5rHWg?9YPWC598PEmmpx%gf__+Uo!$dhtXz_H;ftb=!
z!|fRJtr*L6jAhg?$AyID!oa|CTZZlI=IM;$QRmIbW%utaO8l8~D%y5W!@_cJ<5b1T
z&7;mgMlPGvqC&Ymkk4`oDbfGsB^EuI1<jQZ)(}b|NotN*PTN~Y&t)(y9c5!mxE!gC
zt0c|i*Jj}iRDyl)7Uoa}_rA(84I~U!vuJP+9$;_7Uj}nCKc(GAkY_9*k&s2mKrF<l
zhP(sK%mptT_*(xg>hY=?@x{Vx2kQzp;iHp|t0?U9?-4pYeQrsza={vs?KeJZTTwA+
z$NvTiuzo0(`JrhjldXe8LwO+qtrySA#i7FBHzSSm+C+E-z8<PObc%+r6Mje-AzUC_
zBGBhTq#IT|N|+_6_Z=PSr?*G%qq@D|MjiCHijYrOOL&H`fk4-8z)%w<3X+63SPkj6
z!spNBbDwca;-S+_9~#25`B=C%e1x0tg@F<8(wzBlZHR+_qwtX2`FI4}9VurG%F6Fd
vvn4KyLf_zkev7}SM-as(h&{ZV4M6eX7ng1bW0sfpoZycg{FjEt>LLCwcpUf)

delta 5316
zcmbVQdr(`~nZM^=JrOU10PzsW7#Yhv444GJVhjia0c3}Vu_+)6-D{8yl6@r}!IE*B
zjEkE%_WHC<oONT|rioqK360VjZ?ZGCcW|4XdJ+iUL6P|**<_~K*-fh&XE$k@?S9`C
z!gAwoclOTc_kHI(-}%1txaW7z(VKV4!f`hKH*s+>3_R!l`Bwj`gTIKM;>gea*SJ(R
zy_<jZ8Cho*-_2Km)PvjrGMn$Fzmpe{Zkna28Smz|KO?(@?cwP(@#}>+AwC`SeJo!G
z-fJJQ)Ptn};xvFP<R2H}`Jyo;!|?0*qJ1*H5v)bvzhs37O<*Yo|7MWuKw3bSfZPGH
z6x;6x_q1>j2(S~(Wl;SD$n_vwK$e4S1^EcbHjs~kYzJ8Zau>)AAUi;A1i2gJCVr2w
zdH*OqWKPZxcdHYukMZ9THZOIv3(8w3m{HPM*~*xDf;xI*ozBlI*QSyrdQyLw^(bl1
z>Jpm2I*w{`GEtI5dOkKIzK^>^q={m@j8*L~&xs@DF+pxXaEkR{7fk>`&OJ0Ju0c)K
z>v9c<O<2>6U_n?5Ku;U$h?NEnrKJlwxv!WnXy4FZ)X(Kr{G;|Nf6e(1&bf`vw>&d#
zyXV`wX4|@cb7W>!&s>gmLiR7JEdTJzw^%Yq3-aD27yS3~J|RgLAf%fGFc`#k%<&Uy
zsmi9x{ABX6KQq6aC70+<Q>N~9s0*rXJa4rR*xYWDOl(E(H|WzQBmHc3K7HS$A;0zC
zG0hTkmR>2SBrns?3rw4^ofwPo3W5>gX8<O7IKZoDI0z7ov)Mh4VTb2Qt4A31h!^S3
z!aB0(f3ff#R{3LeATjhn&Nlkey8T2&<t6pxGPRU+lV8%yB{}3R8nR^5;JP&S&y1fd
zt>DNNy16_XeBdoeJdaskM0g6}9r_+rU8kRy_mQ`yhVDnwNP_>_M@|!Rjb>MT2>4}%
zUU3t=$JW6bXVHoc$;9Yy+;BlbZqR#M+sPC3@ygf9Mfz3cTJk#0+qRp!40?KOn~}Uj
zFK^S4SLn@cZ<7-L(W)Su90!4(hTq~S%ylC}m=_qja!snr&Gs>^j9MztH@mdd;8f*3
z&G6(f$1p$QUf_<&<&2N?F+SEy%uM$!hVgM;Zoiz~Xx8rHxl6co@c3jN*h}HZEAyx#
zx<}gHSlY)%d_|2%9jW)qB5$RW@SIN`4sA~Dia7feQGpdvfpJZxCo08qcOV6hSbDsQ
zs1$Oa(#z7lgIb+uMa03QiD*)G*nD{kUK!~?q%p7Z%6T;(<4Iofrh8*k>Cx><`n^rs
zYF-oZ^C~aLURs)qh>bAMy(eS5Y%5d2Jon)$#-od5%wxn=K9!f*pNX4(JkG27d*;V1
zAI~RTPP_z5fDd8%7(2TM7R9GJqH0}|BV>db<@PWm<O(-JOe@Apn;dSBp+m3@J8T}o
zV0R4+2=GR`oNmL2!_#jNoc%VZUEmFag2%?&JhozscpAcsxP;<$fZy5yq({64BB*S4
z9&oxwoDvNTC4wn*?uBQ5fA!>YmM?I5|Me_2RN>wc{upoEQ)C=0GV%sv{U&4cMP)dU
z%=6?yA)M?6eZDSZ{5mun%c~VdmuMJ(ZabWP%Q2&SzR4htfa`YgLqJo!)RCZ;7u<Hy
z(JNS^#u()K1dsSDa0_w{r$^dnLHWJ`m(3GY*bW{PoV=I=wIWXHc#wl}1yyd3xX<Gl
z6vEu_3Fc5sv=CIeh6QohA&f}m7?e3Y!eCHscMUl`R?#*RQHN~<L5<rnCRhi1CHry#
zYQ%qofNp%%4UtEpxL|rFj@df0v{cc<7%PL#o<9Cp>v`aCcOJlJ%$G-*j}nqk`o8ZA
zB&SR?gk(B(YCym8T=$vod41)qzH&}qHJ?^BQ6DHNn`rz<XSmBG#3h}Q1+on1>d(|q
zc3iN{WtE&#FBEUMnm*lnYt{9~Zx`=4TQjLXJ8qe2-*rkI$j&|2f2M!($*EOy*^i#m
zER=7(diYlB?Us()d%9+tx^I{FoE0V;Z)cax@O`H=fyB)D#N64$+y!m!g5EHxeNA^>
zcVYFEX>R3~IsIb+eSRQ2KVT>e<P<Czi(czG-}Td;dE=H@<CdAnn&*s`fT7@Cf+{8T
z3vN7SMN&uuy$$6u+MJo#?2w7kRg<sotz{C^?=mb5G&b>M<MGCsjICD>UA52Xs^9IH
z>F%9qyd7(Y**MYgbx00ge{$Et?0+}GyosFFn>EZE#H^N0)#yN-RuQmHs|o5FwYh?u
z*6Pe<+;kx^SFGozi{w~cCdY~j4s<(A`tq|(r~mW-oziQ&)ih~WGX24TR_#$Nxzp>$
z6nbutO5-D5vP8J_<uz%@wYlHoS|DU#SQfbUJ)~8yjFt?hw6jrEEB7QsI^vaka9c``
zCn=&mK()&>=aon3NTOPW6j`?~!gD@lR9IzHSZyS1RDx)tO^MWdl~D=gKGiZ)GT}iq
zK7>_$YT(?oNQC>+gU2}O@v4D&6%zAiMr`}DXjMf9yFUj>v+6$esvb(cGeEtZM7?)_
zdJT~v67|La^{!f?-kATDdSi~nNYo4RThv=7QSS~QnGT`1y&;;x{;%9SF8(`oOrlHi
zKTyL{*HAn_=-hLs49l^_&$04%2)_pyGd@V7%YM;)c#uVt!UwuWXdTo5X<B=2_5;E=
z@M8v=Vs`ATwOBi9tJ@pIMND%K0f|-o0zo>!{3mMvg|N)2;+I(b3PCz)No=YKv*`*K
zOwEYUJLCu_gIs?^N9o}CHEMtQ4&pZm|BdixfMCLXez!VpK+_VT;@3LDry#?Wnjtaf
z{WSMmy2sYvr__f!JdK>%5aHC2f&mh>oUwe6<+#Al7gx^~SI-w)W{WMij?C}qpWV?v
zSL~QkrGJ=USmNDu<lW+Vea)=CW=>x_pH>^qxrt%U9sir8`~TwHg<Rt#|62d~{tLrX
zPtL8bn#-*|l@LwD0exXWzb2494$NEfx0x4-Hx9ZS%3C7d0!FtTh_~=t#9MitTy@Xr
zYToUe>9Hg6@(&Pi9jwxKx76m4Ysuyk=0?&cVlI~5NUq6%(sU7lis@p4dWpI=i<{o4
zt4-r>t{|Y_Op-(G%``dcSzK+7zsdXoD;*icX^1+;8JepdpTTz=w7Tl>vEnjR4B=rU
zbdEk_Xm*SWy!bv8r42QN$5Ck;!S)nq&=tSR;QAwj*=2W&vr(p34K*%a5O07<`~$*W
z1eRW`D<vP$J9WL8zXpRF$vylQhOaFjLwT$e-?Y<BN;+D<g8a<?{dyN+Q;GlUhFxT%
z7{WMB049Za40UAg@LqWdHQZ-G74LA{dItnPaz9BW^x4K|$@~7arX4J+BDCMKhD{*!
zv?XtIHoUXpTLo^U$dxDstU<Nt8nHT@yf7-JLfI_?2kdURvsyy`U@0ee{Hu5P2nqRL
z*%?RRzVhZ1JBzeZYdDVya4K^-#e6JtaDWPG4i35dt#I-Z;L3>XA$~&FwWN@I+O#*F
z_Ouj}d;SwG&tjnTHfw?j8j5QGEGDH03BT7?P*#Gr0)#>Yi6WLRaz$VWCb&H=(bgv{
zvqTB~w5^_e<1cEzDjUQJ42GvL>P~tCtQJ#Tn5J-gqw1tyvY1MuHdRM$)vkuBwpx+H
zY+OrOOPJW6!e$=;MCK4?-PWm1zXhhhn7UGEIaV&+$bR0bV>PUQy7LZ8LUgjbbqkK!
zB3{8jBpBN&*hG7OYk0zNCQK@rh^29h8!+c)EQTk9uIour;4Fxnr3tn76te}apZ0X&
zjE1b4RTx4X!e&w)c#WjRQt}SlfUD0fZoMB2HEDLa@GV!0yA|Trv71=>!@Zx%Wgc6v
zn;x~N)AP0sh8j4=EaGQ4e5O2d{K(nCxrD+ASs-=ggzSWdezdoT?(WT1RAXc_J=(k5
zP!Da~4{x(-sf~m7+EXHJeD*d)Gqe%w{PXrwqQhyD?j9DnCP*716)iQ?AY{d@ggh`n
z>5gAZ8-&A!E!aiZL%JAD+B~5QB&EJk@OK3h$`C788|hsk*Oakxa_wwJ(S-R#<ChDG
z8D}js2?ci<qBaJgX62c+6Xxd|LmZU-mHXC{!e$)V{XU77=pJC*69_E`t@P!-PE8Mv
zWfzt^DA#|ST=AdikLA+3(6aoFo0b-!i%uPABK!T{9C(=}8T72Pj+p4D&coyvbgygO
zYFsPPh%Ji|$`Q69YypVGu+m?;I>||zc<^gtr?H0yiH(jO%1XnN=>vbE2w)g1LN21e
zI;4d^Q0^RBO}0^1ER##$aJo@^B>b0z^!0AQ<S)@9V%zvnQ2i;w^9WBNyoK;K0{$Bz
zBJqjG5g14#DiA)#qQpkh`~4RK!7U>VBs`?;Sj5k**oe@M(23AP;BAsvF{s=r3T`)W
zct2JMw8y=kRd9alew8R>^1Wm+mR1fOGlupNy*zbFJLQ}$tzBe54{bGoA#du)Y}xij
z2J}TU{q>L|C3i7~ljk9T79%$<>Hui%@HXP~9~+(}$p<iz5ylZzG`afv1h|^g{iC^L
bf}R*Xl~Nr;@?RXD<j;7&U{Du#f#?4K9-FIO

diff --git a/ingest_pipeline/cli/tui/screens/__pycache__/dialogs.cpython-312.pyc b/ingest_pipeline/cli/tui/screens/__pycache__/dialogs.cpython-312.pyc
index 6b9b049d0bc4940ab5c6972ee2094071df43632d..d7c946682ad64b42f491dc43b69fe20f39122154 100644
GIT binary patch
delta 6185
zcmb7IYj9jgmA*ai_e=ATW=7KJt&wC|k}cVmEy<GQ@k`bwwgbr|VHnN5lE%!-eP?1@
zQ6eRn;3S(}vdt@yRFWb^t+1(uH54fd3P?&O;H0oH#LguP&KB^ChZ8yFl&hB7b9zSa
zEE`6u@18#0x4Uom>GPe_k3B{%JxOertX7i%zeD%FF=^|5+U8Z0#qy_{_RJ7LB%(fL
zPFtduv^8qwWkbrAwny!0N7TW~#*{Pdin`Ke(XzBV>P~y2p0qdWP5YugUT;d3rz@fr
zAe%)?%AXEI14NK?)CFa0DwwW}RzjUkw5O`l)zNA$J5r%^P4wOxBB+FYg6KRWh%U(?
zmQ}zk&#7^)f)K6cb#AEhY^bZ_bzZ3RN%nQ`)t@d4m$No9Xfek#nQT6uPi8YRJ5J^U
zVWRl<WK$_Afx5%-OngF0OPTy&F2^>j?wlcuZ^Fo*6}}`$LX?O?RCO0DQB*CeB#o%v
z1$CkZBrQskRxCd&j1y6J#&QnI_>1aPf}|JqqCqq+eFxW=aB<dXtkA}`Mq?M_X3?>v
zn$ScIVg(<-dBzeoN+!`Sy3S~phcb%+vFwZ{Y7v8?8=h7ud*Eq<rx%`fc>3V!I4hhY
zQRh)1T&a|?pLojHL+Z8$>W1kmro{4MP#-F+xj2ROh{*{mNg4JnqZ@67z1ZPBtPzBx
z!W@~ZIwIu@G!x2CN}>GeoFs<gxm+ljk@N9PLTaB=DO$OZlc=HwJ(M)Elp0rzu~;G%
zm*rSYR>45*JDR(6H6Tp+U`lT6q7q7rc7P9Ng_}CT;d%Vz;}2do_!mJXu%D?Dgs@GT
z{lhc_WyKJSB{Ru<EJg!Rq(OkNhSs6Htf2K!lwsaNC={Bd4OqDqU@C}X!i<VNgjt)m
z!B3l@CP4s}ehv_zLvlgZ+SCI!C{Y7~6M+w6M9G3+1(+jzd>Q))@zE50BAd=-Woasa
zBN|GjcJ{X63a%}D(dGI|_TR=QEQjHxr8n6rQ!5!{FPTE5i9J&1gJ#dv&9gakz`F+r
zI{+{`r&V-gg?v7np%JE-{mm4YQ!(YTxzg^<srY;pt@HqFDPQ&w%!~OgePl1Y+cHwI
z;gfN#;P~OR_A!lhyL0ulaOiv3VQV`XVbfNe+jCZ*l`P(^1J@!DI5bA~ZjX;CR;%jL
z^uL)s>~B_&>boV$&H8N~Rc^WTu&r55BddzL*n2%*cG>12)9f9a5AfUeD(1775#DIG
z-OU>ux7&CFuS!47p0-!>cAF5L-OTMMFI8HwvWg`f&QjGk9H!C$Hg?Tn;qq-qaWF5d
zaVCo|Ivk?$yzU&@DEx?k{q89B>0B8w#P+zb=XY#gm3u{9oJS9P*X7Yn3&(@(k?Jyw
zXKioYzHP!k|FurYR~5$)gnEJ2Jf!8FS-sQRuL{qpM5E|CU(TK=3zG`=9l#yzw`B$W
zFuXEK$5_;Tj!ZJ0r;!D{ZT?BnD!O!>eyWfQJ674h#KydlV`vvNif#0haXFsP!_k!U
zl#Zdwl!&KNu~a+{2R0C+(m0jm$ymt?tat}mG44H;kaFlY!#Y~We&^lifKvs(;<>`k
zSck>S{u0)+w>>7~9iWhJ!8)=D-+=$+`m4Po3%w&(d+%E4z3Xc4eG9$!UG1IxW$)yL
zulo+DtY03!8r-!I-1TzeSC%36LB-*jN6APFIkVS!s85*ppgiv#G(q8F2n!c$23w%;
znwcEhsd>%Pg>pYuyf!eTfx;y<7A|ReQ10dOPJ(iuaimH8y3RLJtA4#w3vFJn)uN_J
z4f3kv52qS!01w0Bb~e}_V4w5^Cy8*HgjG{*`=u0kxKLWkPiDnXJ{u}6T&TEkp;Zgl
zJ{neW_oS39t?sH?y8eLWVbH0~=q+ac&TcSVT=d|x!gYh?s=>ct@Lx5wFBsZ?ZRp^h
z3>>eHaz{-)&<=bf_gMH2pAC2S;2|DH1sq_ZBrBTHY(|>X(EF-EIb|E-E~fnsFbi1{
zi_IT_ny`z#>fbb@*kiF(BpZt<h8)ep+T>4je?;}rRxu167#%(^y6-4=ztjafI*M=%
z;eLdB5YUJyu7F}K(M3W6>x_YCtp_dlkGqTZ=EtV~E<ofh`HKJ_d`5Unv-P^8>WZf7
zT3PEAP3v{7^`=Ut4J@h!o$Urn@0wV1`_5hO+tk|D8z#`cr*de0rFxX=Roa$CgH~I+
zXj5ss77c?$dq24qfp<Ikx>7%D3zkEm@Ov2XqXi104nhWfDP$-zx?w}eU=$%lSmJ&j
zGFU|Gh5*4-iVtRBaNfuXja*BwVaQ+<R{lgk4<E`(;X?q!gjL}~kcSHvv66=iRtO_7
zT(H5j9K#15HaH+`s8RxZvYGKDO%G=i1q_#l+2`ubEK%9geA}2x%K3Z2o!qbJ#cU#$
z6lES-6wR$1=E==%btKWG!AOFl`=e-Nv=*R9PqW3%MUORA&1UO^cSB(C0=8*HK)#~Q
z2w{X4gjR$$giQ$T2%8Z)5IO-8Fy8VH4s?;>{#1G7&=x3!wLG9GTIRokV#R+#RUInU
zYKx|*g$ne3r5SH!p}Lyoh~hlEP_=m@yJ83d9g_d7ewvtju;*<6Qz6!`53wJF+@2k%
z>qY2C7(m#~{uc7h(7h<{M?m(c2N4bdDEd@3E+#V*VL~IQ903TM=-O~aQKzKLs_$3{
zTrl9`(aQ!;ga>r0uDJ8;!J10l_dp?^XYUw%?7KBz^Q>}~f`ChmzLI5XAJ~PiKXThp
zSDG2U6Uw7uH9Z1Pu#%*lOT|yqqfpu~=rLHwFuBAI)^(DV*ym#KW7zoP2=@Xk$1<q6
zpFLRLRd*T1Payogpk}|}lh6bla-4-4yx#TB7oE^lC)ypGZ19k)?BNCsbDnST8OdT4
zz7N72_7h75yVel2C54Anc{Bt5V<*gB=5Cw_s8@8;YEiSq{j_UZ&1ScH+4;spPE{Ub
zNd6NIXM|}LyX*?G`lf24x-i`IE(xMLJErL6e3n9nLcan<ipBw(e3IQ6E{BNlczAn=
z+b>ZxW7%vftWs3%9rQG`T3#OZO8B41pP8#=uxcE;m;jh^M&ij7MD4&@qLh;IQiu+-
z6D@T^$8i7`-zEAbY<>a(BWwCB0-we5S%4U#kXCdL#8U-Hrk}?KS@vd2%RS5C1}%Ux
ztS_D+2C||D7Ad6iGVf0@$%RA$Xl1;RQgq{dQgjNM$;cUaw%}Lv2RQOn8{e0|gdMuy
zV576_$<}H^rLq26Q~2yY_RZEvO?mKn%QKd1&29f-pR>QLTWB7*p%ohX76o;K_m-fp
zh7D@_KJl_&v>lvjCC?5H?Cla>36Q<*npc8Dtx%ZPlf509c|#S-jfO}onQtd3cW~@7
zMuO`3oxX@qebJ?jR0|h<TF_h!s!^^sMw-<Zo7M0ZeF$a<VG>`ge*t+t`Ie&tryOQc
zdK4h+q@PCl48ms+9z*yn!dV2qu(&q#afGc1|0k95&3XcxJPELxIiEu14#a1$=34-q
zIlHb~y;n5eYyUrg4ju5{&>De2b%Lkvh8`t@P~P#r5hX7tRp&CPqSUAcQZ<!Gweyyt
zR$E{6<xjE8?LHvWw_y?=jZFW+tb2VP4q3QpUFJ(QPqAk(iMK81*!DFfSs^-r3@u^>
zTv8NsY{<bmNn-A8FXi42AW_V{ozM<*Zx=j~Ov^Zlx;cs3N3s(iOG+mtdXy*EQ(K0M
zo{(8P+PbG~N0Nz2XcC$ZVFad_W2x*!>||1$kn*?9cf|9POEpGbGY*G%HLD){XslYc
zZWir8usQ-3v5H{Xv5wACdis3F@FwnMG&BTzR5ZGCD18%Q19NX>zRpUOldzu7hK&Sh
zf_IPrzn1SLWE(4V4MUpy{jO>qXRht+cU{d(qIFB_{<R!N9XO&D;V=L<>5_loROMU$
zWu<J}OW5p|N8uXdS$1N3fQ7ccwHb-1*d6~A?&tXF`r(K5evCDDSCU#5=^onnNz26d
zV)yp~D;@o4eMe00X(eIye9sn56V#P<?(>jY1etN$SHpZF%kxq!M+%vIGA-?;G)vcf
zFMDHKH`&b8+eeBW&F;i&gzWZrT3*F5Ujk6HCuuS-frCv@xZjCM84&_{Sa_&OB{P!D
zPVESi2KI#=n{_>~_wqs3vD3|dyQ6n?mz}*|Z=8pBkhyu+KgIrEL--lM(!C070sEic
zO{AZ-?%cQP{R>~%X(rpbmGI9(##3~KoCv8V^vGvpKodtphIz%uq?D|NM%?SOE4#Yk
zlET<`Ab`uYCe~1a0vfK$%h*eOHD11fQK(zHT)*ktOh%cxKd^D{ki4-YHqiek9S^o9
zSm!`x9dc!aaynEM?L51o+Y<xZ$PqR-5ShXGafeT5Q9`E<0S3>j&|)F;`Z?-34RGxv
zMeQ$9dmdp$>-oniU}ilB{204@72yqpUm*Mn;Z1~V2p`G|-@qCKxb+ZZ<ZDg~eb=4U
zS2Wev?EWhn|A!=0#KgY6yIb|1iv4xBZ)VY=)rJ;rI_;)KhZex5ha}3S(pKGqoa#6!
zdVL%u+`#EgF~wrz1-MU?;3f}uU(x5l)uobS6i=3-gBwN&ZYge+V$Msa@`ZQ`eHPDI
z75kEAESbR|I8@9xT}$djHj|Ho#Z$R>b!TJ?gYFp<bVkkC<MR7OKP#_X<`n~IJGSJ0
zhnugnIGY$uL(0f_tIQW4?q0GGN|h2HZikq2D@HLcPmX2dR4iVu8X-Y~{3!yLag=99
ze(e4!1YDB2Qi9U}@@>N|=(CWL`sp8`2s<LkIe;5#LdaV}-yeip_S{h2zD@t7*#iGJ
zbq^EL`Q^qJ+|RV#6i~i7tPu&Rf1&Z;-7kU)<(s4Gj}vm7eC|^()Gv6O-WPa@Z^{1x
DCdZoK

delta 5633
zcma)AYit|Wm7dF);hPlSlteu!Q=&w@Y{`-3muyS6>9}?jH%`)&P0CQ5kxh3<s&^>c
zag)&9I8D^FS-ZDw(k4x$7HDF)*iGxAkF-UT)ONaY7O3Gh;>@C{i(-NO(T7?lo51Lz
zd(I3giFN|)1^C@_&pC7No%=Z79A12aeBlekebMEzb5J5z-aI%pbjls#xe9lxdwV(W
zNI3{65y_%B^RARD?@qb(wpD4!ds3dfH|5RyQog)D<<AFFfqXC()a^DUln<xEAloH}
z(wJ{bH4#o0s8e!EE~PmiNkzcsl-x>7zBScKI1{&vlNwHNl1Fw+-X@sL8J^pYlj2fs
zy3q$l{|cjFYu9Z7umxq;(u0OA`hYhPVmrt<`zm>jeb)5xGFQ0<rpLIaIGIZkiA$O8
zg11ZYvLK6+X*1X)9wY%J6DOM`Q8G&wn2BC=ja9Nq_BxFNe4KR}7x=hqngc@0BAH}C
z5~LhIEj-Rm6L?W)$|~F7W$n`@$$LULV~oJ198#m?KOv-?Qb2YcYN@JMRFX&XO$$;G
zd>X(v1hoh1Fx1}1xuYcI+s`GM*gQWT)$G}#qR81&u2`T!=tFbOWT;#yrPVBz<pOIE
zvxH-+c<WY8RA*;os#(+NTp?FVrzvg$Z3ajPnxM+c^s+{?rPEm@qpIn&Du72c%8m<n
zksfwk>>wSi#oX0d0X3(Ysa%?+1sG(xctDK7ukuAU*>U^X@0ovL8gfCKS`g4`3}i*g
zf#3u<O=tot6?=-(KK4ypg2dT5+hsDz=7$6D7SFp{SzC{t9f`EFzu7a+<VyFnqmOK0
zPdK8{eo$+od>B?CYXZ4eP{wU$zw0{B=A4lb9sxQ5FnL<k%u}<a5-j3Y_Oi1%uJM_f
z8O=UZoT)D4X_G!XItlJ7_7ufA{@po7#@I&JUeeFDt%th+b1ZvT&I^aw&sMt!$qx2u
zcNF}}?y#4ud?4Z>-NO+$s5WknE%+ns6}QE-FvqSrg6ti4(DZ~MKG)F0(_~HFN9Ne8
z;A{8TLCSbTCIJ;~Y>&qe3VgQY34pZV53=Vx?y8do746V?)jt6E7yk&m)!V2W!+;CW
z!Bbvu)$)!P`^HfOpV3vsai+S#5Aph_>@HtUe>%jj_!{)*)(HX~F{b2Q9xcj___1G{
zX<%7hokZUpcPIi&bVJcEQ1FCR3Z1ELAb}-<Nry+dFa39nD=l4`PL6gwB<kI}!Viki
zaNjb)#ccdu6MHj|AkFN50EbyLIBOY$F(&D~?AhQMGR1BU#iMm+7RT|!ud*KCYvd_z
zj<AkxYaIJI8V60nM4Q>0k;YXClSb0ULDf&eaoPvw>(<RmCO;)*wj3K}FNC|+4Q^J7
z*^HuY0l_dl3T|o$;Dh7by!2Ll{iXQ&x8i#*#rIy0Pafweo?2E2^*2v}pqcX-`kC38
zM8ooxq-plUP;&H6Fw?ux$8s>EW=bWh@oI_Edr@VFF_pBEDZxFr?L3;5XD~1%%rwC!
z!@FGfN3rNLhL!ksxYvFwJf&*zCLgdX;jL!}8+V&*ms=)(vv2=@IPYX9nr|yVLiTJV
zkM8K+<KoWsqkL{)+zyTNqu4mVe!LeNudgC|9K!3dVUT|vM8mH`69P2eXvW4Hk<}ny
zw4;2{K~Q$t_KfluL*YHc{KWwg^}`}+MtP9ovJJq*CKG;*{Yy)Knc~i94e4~IP$-r%
z_)ZX*s2R1^iQSVsc2DlwPkW$Ay$Eo(IJyhrHUtbYnq?oARaKVgCs4H?L0>XgHPB^c
zSh+L=p<XcQL1>$?P>ozC_%?zzfR^t9eDEmuws6ZePupdo?W%v^vM}&hGkbo`SeY05
z=C>?zQ2l1&-uJLxv~y<nqRAtMpKkpd2UUfyDJq>Nv3JobimT=izwq$F!;2h<KY_Rk
zRmE)*hu^o36Y)Nx9}Rs1lUW#isbKiTQn?PG6JGfy#={T~9H;Z1YypYi3>ry5-a`ra
z&WijeS!-OTYk>bGN1etAKCU{A8+;mS8el-1WGW-c;*dbG79dt(+N@t?4{)Jfc1T{?
z30&w~!G$iVNeTe3xq;go4n^V78;azW{J@3CfnM-M4)j6Y2(@45!T@k#vliK2EKKLv
zg;<Ei+I!QQMJi^~IY~9H4_-T+=qLso+JexE(1y^C5Jl)fScQP}MPc8$EV5s%AbaQx
zG8VmKpB@%O+6_A6=$$}mnNvlBFzU6&>B94gH_-?l`qRfc*{iV@U|oZopJ77B>NboC
z`c0?{Rc_GY{Lb#}I7Q5>(Ps_&!>SE~!zivr7)8KHMmHdAMA(FYdrmPF(k*N#7XFlG
zQHmKUS2&O$bStWN0wnCTo~|`skqdPBO_qrp=c2PWO@dV8ZdC4KKacg0@3Q}j{SpYA
zbR&WPwDa)zZZIaVTVvI6>Bpcwnc(RjsA1c3>Wq?kfbPXEZtM~-v$0O>OI=p-GW%NB
zkg-O{${)q`7h3jVXCFtn8(@jOQSk}(YJAx7OBC-xSf=q^YiJ5I5cod@mFAITMJ~x{
zI9IcI__9!Mn%#c(<?eOl0z20ojo`-B?U@-AkHD{TH~UBTCbp&Lv52XJ$3QO+nk1pd
zbaePZ6T8-v@$)5&WqOgUC%7_y$j^wgnH3W4gg^Ua;;&@ni(tJ|v#6ya%^Z;FlhCAi
z2w*cyP)*iN0S_`B4)(*o^-=xs5>1#Y78Rg0)8HC<7;H;x!<_xMlmBG*_K&yS4|<vb
zIOa`ea*8ZPOU0<M8c{mNe%2qGI0)8+Pv1iN1iBXy@XL~(M9?R;bbNrXX7if)a7LMx
zRr)wO<XLo}_s%71qZE`0i*bP-t97GUAcD^-B~`Plv)L>}^XXYdGf(T2qDR0@#Scup
zSWt}M{Um#CV95Li+8$w72HN=+TPOSbK(Zsy_|)E0d#`r(ym0%%?Jp%Sb#7V|xvsGa
z$9MVO=lFIX%MQLwe5`Ht$I1!v?D*KuHQZ}WWM{wdTJuC7G|r1;=b&)j+=g<eHJKpi
z`w7Z}I<B!LoB8t_!pR_i!6PPHxeGxNG#8qAlv{1dIDa9|!&CGqOfC_m4?snaA$$(u
zK>$rqazO3n8B{!k;77o-L?1@zLHH=fqh+)%vz@*P$5HorfRzk~2a_Uv84Y+Dbb=ec
z=JKA5&3)2)SqNRdk?SVP!IRljO^c!pIL^!kV~ZA)tX$*pdp49pI?Z_v-h-;jdnm<u
z;63|C^4`$<)()}LU_G2w7Jf?wcNj}W65xyU!_qv-bPSvz#nY({$*<b3rF_Ut^(i0F
z-%T2w0@?S6{ACxgmrb@yPT2wM<zB&FPGF)2U?OBO57ch(5sYjPGB=;>k@Ykel3){X
z80LJwo3zM&eqg`qJgdIQcL9U%0;yn?@IpG_g^}=B*Kjg2sX5Y0@j&`WPC6i$AZ5eG
zG+a>{Vd1qyqD~#v-08lxJ8sc0y|99@=3yb}0surg%)JbDTJc>=d)V(rgZ3ILUFX=J
z)^;`B6y5CbYz%(i>AQuHHLQPR2ieFzJJN2}DP@R#eWa%*o*U`wttS`SfFnB*k^uD_
z(zLF{^bd}WuKOqWzv5Z8;EJ%f*1f$N$-;PU9wj~8=+WaPY~I+-ZSWGU#KHb|bYdw_
zyJ!86Bg>Ed;Ks*T?}k3O{daFzE8yGWBEkf|%Kp5qg}t)jnZ!Ikurv$JdB<#_l*`LI
zDJ{~v@!5%uBczeNym4<eFI92{S*_zL49q+Z(!S~UJwL*Zp9avxBQ#f%A=YInr1)vM
zAe|PBUHUOP_ik<>eQej})uf#r*}UJN9NfBEsdZa9$~rd1nPcqX_)o!xT&oZAGicDC
zBm4rOn&s<R?Z1u<kZ$(dv0X8Icg<QmRv$X+vtwHvWGx;dV?8|hh<SEKf+Pfn(vQ`z
zP$w#xDOpkRP4)21j&B_ygX~9Jca#3FYzxEku7~A~Kz1Kv_iSqpEwjPO{bY}CTRk!g
zS6}r(N5{EqR_8xk=d5p8BbTg^E7n#$Y}D}{vaG(mf86#*v;Iw#VegE$#_k7wlIqlD
z(k}tcgQkA-+9pQHCU*BkvWzQXgzCl*3)RM9)MGS`_5X>{XVFjJiEp8#2l-b}dJW-q
zgnvW0h_L-Q;^zTY2JYukiSTDM{5yaixW}$}8=t=A6l5puR~!5%rMb^t7MdYLd1m`a
zdC_DuLNZj<kc?7D6bCA9K^$0giehv=j7dmz(QOt7<~!%rg~TEU;!8pWt3?ku&j;qS
z3r(1^47^xE?}0_PMI3%nc(HWavB-h=6Yz$r;xmbD??aYz2osrdb;5}bgW)VQnbJWe
zH$`#PG;`^J8Tb~Zcyu*KNj_Sd%_xKLPmG??X$>{aRIY&EtVROpt7)^vLMa2ci>k&S
zO;+s1U9%ehhpnSF&{7Oo%iS6AQ(gWm%J}?sqo*F6JnYhru!2MjiFpyeeN-bOwMiNE
z;8Za~CF8$0+w#|82p?`lcmx4A>9mpL*Zweoj%F2k3%v>^IM1A_04(x^khi%pmf0Cg
zuKlgB_FeNVA@`A|<MV-U^uNpLjdv;kX+k>Z<1YplK!@_X6Z{>793m$_Gv9eB)cqc(
IxAe>Kf3p(jo&W#<

diff --git a/ingest_pipeline/cli/tui/screens/__pycache__/documents.cpython-312.pyc b/ingest_pipeline/cli/tui/screens/__pycache__/documents.cpython-312.pyc
index 9355284e9557e9aa7fc95aa8da382bfcfbc89f8e..5d61cd66bc30214f4f976000379be76bdbb6ae9e 100644
GIT binary patch
delta 7388
zcmdTpZE#e_k#F|<TdNPGm5{`fv`DOk76b^e#Fst+W68b%{#Y9?%g&Qn*ww=93c*@r
zu|wG+@dxrt0zTUnTy<B5!dG{Wu2MLa_~N@Nf5krUMi9yGoETp@SLaJPR!%tfk-PZ1
z=j~fb2K(;M{kW}C_q?9&nVz1Wp6=0QnLPRuasAxsv<dLrQ~mb-mpaB>9&&ZOp*<b5
z2CPJ&gqotZm_1;RIRXy;ZH_u)u7E365GaVb1MXO1pfFYxD2f#aien{#63%0ZE{c@~
zN}+9~wrE+*6YxOWP94$mSVf>Bwm7hue><a<v8q575p=><fx1o#v_NuDcex-m2^aOK
zl^_JFd1oPX7D;yAIoG%3nA=x8{vqwvE7q>~P%;!5l9*!K7H5$ZenyqzonaP_Mnn6e
zQl7!5Q|x_l8j3=nBn>Gh75mI`l&rE^`a<j=jgJh;&yu*UNYz4^{h?f{`{ABaTBa$c
z6F^rF{W7JTR?x)@cq(t8RMBd>WC4#zi)o3xRKF?Bhi#-ybh*Yb=n6QgPBKt~WTN_%
zSr7&cW5NKT%_kiJmsCLgl6yc$SDZ9l%qbfvq&;-yNkgCra0}pKz^ee40A3Av5#Tj|
zOF`C>8&gMHfs!tRuC>tc0A2^U9PoO;6@YI6yclpB;7Y*lfU5v+09*}tBj6=~Hvtyu
zW~t^tcTS^ui2A91z(BVEPaW`h58OJhQ;=^rm<Lsk4&bQg9R2e-)OK!^PT*O_dA{+L
zJYB%k2wHUmZW<GglECtvg0ENc$RVdke%o+?T$e|TO=aYW;ye<OMuIdR9*#*vNyTs{
zd`>)P{4Hr&48yZZ1XTbOeL_mIYW!S+Km_13D29X-9bhV}{8Mw(v=Qj38knct8Vp8;
zBFSKI`NW@D&g;kp`MT{HvQ0i?Uq$*S-n3f@=)wBsDaX1VCk|;sP>6t!=fakVz=Hss
zKwx$R1qd7fKzuWx1OXtj4tb~3Pg*A)az3Xc9@*>mmte1AOyW^U=#UAy2HY#j9TR8V
zT}E>lXuDXC{K29I2U=V)fFXjcS1u{7BY}zarB*^Z<j%5fWJLZ>SsUq;UoETkA}8xb
zkV5bPf>8wDMDQ?zM`VX*&)%KT?Dgr`w*f1r7#y<UL%tFgLyjQ?XkEn>jU<x!9Z0B4
z<~Bw%C{}3*wuXh05-UTQhmfcrgw3du-|*CsE%I+YyG*!JcE8+H?lpB_^ROH*UrvG(
z&y;^*>ZU;1<s*tY9FGpih7wFdmH`BV2=*h0AUJ^FAc80YzS01;9+2M`y^ia8zu&K}
z^|)M6b2oWJ-d|I52iiih>>f%+l2M6rt9(?4Qrs43_>U|Ad`0TgaXS@bI4Xr0iz6HQ
zm+D%$IQF>wZcR_;_mImRqBO|jBR(tNX_mnLv)E$+$CJWIm@aRB#gROAND9(O;!ren
z4EA7eZK-OFC*{%FM)LT?^R=t>4Yz@Kzt5=Z;=%zji17Ip)9@h*miFn{W|`DCs?xID
zQr}AcULLIPCY=*6)W1a*Z3l^u(Ct!|o%`b>k)c76-6}t}tiF$L?wk|jJ}UZHWJsNa
zuT%sY`w;-2SzXm0WU?jW5WUe45{faA46!6z|D>-$RpGmGv(Hanm+$la9GtLbRry3m
zV>>Cvjb&)xexD_0TltBmN)umDmHc9p=w#44=lj2I+D5KSG%R053J;^~UhLJ5&w=I*
z<f{C9vzVLWgXSKx16`mW6nzcZ@%SqyCdJ}MBt;K<!`?vhlL%x0Xg6&09WvoriqHh!
zY9c>*hgbBI59Ob&I0<I#S!pJ1>fok%4)8XLFC6rOZf?-Il|0<iNoM3XTJGY?W|s2E
zbm2zng-a}5-Az7|?_IqKH2Cw?4nlq`Kfk7{>=ekM3HkcWG!lx&2NUd<GHI=><FV*8
zFu+0Pi~A+C^LjvADU}bmmdbawwvhjl$6D`(p+9Ifk>>4uP~%*<RKpry+>ORBS+|8)
z<lXD;h4s9+?qd-hM-2sEA@K70EyN{%vHmu7w`A#-Cl_;}ui!6g>m()e?zVQ|A8-4U
zAJt<&&gsY(DI#Uz5ZZ>mEdR8<975q#`xa6mdp1y5<naydy1lof3|>TR7lJzx+>PKa
z0ANzZv~M_>j1Q@y<W1~(55X@GTt@I~1XlrQ`}{A^&f8b^Z0;nr^1YjXV(J8XSSM$f
zmrS&5`CD?Y>O5A(3h@DM8Y&%~cgDCoyaf{MCLZN8s5^->abIQsh;teMfTQ9av89ue
z7Wpqbp8;cS>h6{w?rJLHDu0BGc;YzQKXmOY-wekm;R4DD;i|<kWvR|us;^i?hJwj5
zzQhGWz^T;Bww`+VlkN`ECAajHSMsIdG1Pt-F7e#V+KB90S|Q(2Z804s#|eb^7JsRZ
zZIV~6EtSs|me`Y4O=eVnaAleNW?^ZX638d>DdWZ5z(hD^9u*EaHU2qFbyWX?;UX>z
zeqY09q^5;@K1*s1W(;C-za)ks|AZVu)WrwnKvQkH2L?-3_Q%CUGR{JSlDIDvJ}3=Q
zF?1vp;rS`s2`uas@|6IemW7D<*ggea`RK!Qk#|u-0icw0=aLr8a$#Pc->PQ}k1MOn
z0?h9fmk5QEk@!#$Qy%$uO<wtT>&@u}`OkLT%n0zpW)_uB6*XmxnkI{yGxp}O)c~do
zik}$$_UN>`<cww9GUfJW-QLSfZ@E-=DfxG!FO9yw>z&{m!OWg;wvSFOm9Dr4t^%ih
z+@7gy``KNm?N{7=R~_yrcAVOg@%S&5kL|eP=qhBm`QZCqfckySY+MfXG^{K|eG7uY
z(9jTE3#fG>7-S_tW&ebLrvjU>^$>yw<rjO3)0lg)A_VBlEQBD5fQOqWv4v5ZeHQ@_
z==?ywgP(H;lAq7~sbv3*y}v<#$(LfjgGq@5T)Y2<Bz~3Kz7ZeU6(1ag8=bO`k;%G~
zU(OxTDEkDzU0rzDt3+4|`#s8D!yaca7><S#iLexn27{2$Z2>C3k+!f7<f_m>A$EK$
zKi7MYMSnVYZeY^VEdQbRF-ui}+jL^vOs)K#t)G<58V$zU&m0zGH{o{W;{D<A!bRyr
zApeMPMv#O6p+Z1MNkC6^0RvPYMyjU<YSgL^PBG1=4C(?VYL?8@0=0uxvJRMdHDZHm
z#76Cs9cmE=q}mSZqE5h0o^rb&<t|{eFm0-_FP?_tOHA<UOB{$Z5#0{chP=<`PLDs7
z1s}9w9J-l*ix2QF><&dEgF|g%7+hasVk|;wRBGqF$89&tr*j8H+$83!!g+&@L}+q<
zn|RC0rRoqk!G0++xIft@u5X=3#4|j|;=@C<P4p&)*+3|qn-xX&#Tk`Y8-#;M_@L-L
z#3GRO9>XEiqIfg4G_CwGtWKNvOCgY-r`Lk%<_(9Fi4bw3ahT1Ul#V9n^gaZM37ED`
zY?-6cbUb_z^ok#vqiO3~t&;v1>S+<~f&3=iY%XowmI0=XEQ-6}!l*%Ct_7eNyQ1-g
zq>#gkMRNeP)H({iVLZLs4{rf}6JXl<J#t3C1Fil}8RSn*%hRL!Q6ZQYIVSiBX15!F
zhw*@50Dqbr9J+WGvyiGDJ0r-TSx=}(52aI8H}gWjR@xmQ!T}-S1;)=$2=7^(r_5Q4
z=dz_@+9Qq`9(7KaRReNNFY%8Vu2?G7BZ+}73_9h1HfYts-|U9~cEJ4ui_G^Yaq;{|
z30!(*1v<Rjs6h1<!qY<1EZ@7OI!!t8Vor$a4|c<nb<{9KsPSpxSv_1^X6<^LyD*a&
z(D;wSseZwh=g41?)DBc_R0oWaQ%2+bJ~>0+x=agyr5_<aXa8^k3^(%w`DFg=wu!t_
z{D^PIv(U@1oJu+7yF1&8q{X+zL+G|QMg+fKacf=@%()=D4`h@A^(&nWMpfaIQyn<R
z1$ny(=fv2__>S|+0J96`Mu7UVy#TZ#0KY>3Qk6H|_i#LR2po45Y?4R;+rRRCPrJ(A
za}-S%)tvJ_-~3$j-<Y$t>n{~ws?F4H%+zdpOaFTJJAH5TWdfn>ZTlv-g);;Df3a=<
zOT(F=Lzzv7Gj2BRslR5_J6+c-f>V6Y?a7p{&9wJjcK5&M7Bk+~%kH()o`!2?gVQx@
zw-wlC1)J6O9|>I9LmmE(m85EcJK^qq3;t$bhTQ^pk_(oukY90$`r|sQykcz`q)m;G
z@W_9vtk^e~&3sFs#s@&)`-U_6hmA(zxIUS8gHe4F6FmOYww^soO^{8YDZliiX7tdf
z1!}>5`GeKP4QT%_{qUVo8w+^tU(4&D&Uw5pjn{XxaSNzh<E4d98)%Wnz58a|#S643
z8P$U>i=K5JHw=yae_LPE|Gd7^XYI!gqvSxb{Gh)$ZP1Q3yv%w=b-{c%IA&ZYoF<QU
z)(OcHZQHz1{T?@>tVWr`v}_c^jBakcd%&BH8^39Mv{}U?WJEZszegA$b@{o{>Ht~?
z4<Y5LdJF?%2(skdI|fg!wd1el*#1;uokr6_Ldsp2JN8;M;6;~@FuYXyQ@T1e7NuM^
zTVvzSczT$HrMAXKkw4g^^!+P3Qg-Os1&=74JPKm$IDnJ`$alfjp5XL{k*-5<D|Wh3
zCK8k2%_4S)GdzN1v(47r+-$Qc#Fko>Yd3b~N(9J&V!BXLuJIJ7bL(uhrP}Mn9(WRB
zq819Z7-X~cLd76axW7e=bT`DvHnG>|P+vfJT&n~P6bpk#vWRp<QbQkFft^6WQ|8C9
z^&>$@3k;u{_=B9!#4kt1r5O^^B7AAP9~cxn7+kZpQiv-ECE@)^BeAD|i3cUTLa{u=
zQSr9^iaQhvkr?Dr>EtPlrn3NeG`(70^@HlCsx!;le{%O^dGDBOx~TMwf83v`Sv^^_
zX3RWesJD8rir(iP&pD>V)~wiy<%o0Kd6s6~b<?7EN?el_*UT7&nzgfnzQ*;LpkM47
z+i}eyxGT;!{YBz(LDTfI#`A0bdgFzSm&&r~rjATw=Zv81BF?MM!YB5e+B4;>&N{2l
zj-KB=>0F(0teFu=t9{yD@WjSb8>j4*S$pN#`_JDuX>ZHe+M#cQV;ZWOzEgcuj;gGq
z>TL9U$E3r5{&2?L0==u;IsK;GHCcDfxu)~OlkV0`!P*(Yu#U`F(t^%;!U>EnGE;0@
zY5<-YkKk*{EBJq`U;1klG=hS5&?&=paxR{7)MOnsncCHt!6-IiiFa)4W4F(2Ct%>~
z*E)&dF8_CdSO>|pqaw%Z4Q2L)Ga;I(m8Kj6S;xR1XY|PN#~D*jJpG@EK5&wUmTj#f
z7uWSR2(Q$VUa#Smy6#)x<JC$F&|mcuY&Tf9y7aHEEZJ(+zh*FQEfij}8iDefOONeB
z>(&bWYZZFnXP?4|P<)J|3;qGYX9zwApxC>6dOLRCwkz1Rb0>q05B&c+cJhi6!<~9O
z)YK6_LkQ51*%t^PKU+|sVS&S|oL$&~Y02j&g?9~WW(=NU%ZVMoUn^MMr!AR^#`9Yz
zEo<Jj6r9#)7A-wDGHF>cW7NA%8=!cz8H_8=Rf0npS6s4ll)3YsPw{icVK>^&R?P~4
zKC5Uldes~fC-sT!bNTUY{dX|DgcTPS0mGrFUoEm2zKbwSEtLYTM?K96^}h%X?8hsf
z;oYugLOga9%2nIT_F);VIC3u+{(Yf@#H(+3#*b4enqXL<bDJq<ZCDSIc)g11T@X}N
zJD`2tvH`?~qtYe@{{}=03W>Yq@$IGCw`Yaz?+gC-g*{Wko~*FvS3>=7gk|pwEx!^P
ou9>zNNjEur<Q#o!^qRmwuJzjX65>7EelD3^y!=xEKlnWV4OHY2EdT%j

delta 3194
zcmZ`*du&@*8NbJN?CZpK?B?M(X&NVKlis8;Zkk8)Xx>fJQn{hYwBnMwuFp;C?%Gbz
zwfhpZnUt{(hG09I)J;`k|4{~`5X3{`(J|0AG9)TmMZ2Yh4T4mlEW9N^g6})mZ5qn_
z$M5_6o$q|-d!6sxXTL*ka^hKZy9*`wb-wlX@k4FTc`C@apKI*7KqN}2U2~=iqlJQZ
zXhkVk)Rl5a-6>DhlPZoDr@T>b$`|#Cby?exDv6c=@1%uVX{sz*27D29Y2_(@)Ss$|
zR*3&@Es&~=Ruah~?UATwUZTZnA@v5pg;%WTh$Ka;&RV^SkGlvZ7JicWT?#Sm6A7lO
zX~oXJNm}`zNxINyYD<5)#7|hhK2<_X?;Eg4s*9FWKdo3N2|OaHq*Zj|I-P3jrM`8N
zO|*sv`B`h<g&ByQT2vdgsdj2T=a8gn+eK-b(587;)T0*DX4N}wq1)zdujE~e`sg5S
znYTqZ01W{x0s0}Jr9i_#%YbeNS`K^VyiE&j1&JS4b^xsa+6FX0y9Q}HFqI(a09pmK
z6X-^uJAqaM?E<<9XgAOrpgll?w3k0=^ZS~qb=pREfux@Hs+&*j<A1W1<fVNeZ4lB3
zO5LVzKS;O2?t3<WnJF0nNz+B?42d>RNXiheEqI-r<0}Qt3tR2KBikz=Y=)I&l>mlS
zSF@}N|87L622gB<O;@#PW~%aGStA|%n%qE|7nbBNT8P5uiY}7@UhQfnqYL9MC$TAn
zjq)jX=k6l3Vn^^G2oo;k&@wASfSO3miQq=S&b~_6P9Qn~2(oVejypu!7G%%M7E;E)
z<PDYLs!@=QAJbIbf=a0M2XB}hSg7_57dWCIn`C`_ro7QLin=zMNyJz`f2q8l99;N*
zxs#A?{-%G7oZ`NUZqmc|SJZ7rP1cWa5`iJ;2swmLAe`sVS4`D?7}!z8!kz?b*i&)#
zL~d3oWfV13gaG#iN}EKCB99oi;Z)PPl*-~+m6f8>Srl4lAmNq#K%ka%@soi`JBG#{
z<BNgKMcv3A2RPTrzt$Pxt9}nTvQSs~AN$B*kWRuCb0jiaE|u2V$53|);Rr$u;V42J
z;TS>!LBx0vImXr6&8~CSP$*<ZndL9k9wO)YA8TvJF$;$LSUQ``YAO}^xLc3AL>4gR
zcVz%&gBdgy(kMu1YMilYRKsR6`v{|CPw`mY?!>dG<%m-nW0}*6Q`DH9!1d4KiVR(*
zCbDqcgUlPQ?Acj0Mw9xi7C+0*qnd?gb!?a5{T~x~dIm)2wun3h>s{nC3oZ3Ktc@ce
zjVJ}Cm!k1r28r;@u;*qe6hpDHo&4#BCNtfiLNnpK83+GGgO|L<?=_5&o`u%Nw@KL`
ztluT5Bu^aAoKB`^f^3MFC=KnR`fFW|bvLZ3WSWT+MM6YFd>IxLhZ+1NPb+@1oqtkk
zbc!fG4U7D%omD(o?<ky&&#19vdOGt4e@|Hi4_<AWB<)ywh82h?@<ZA8C2~y9uvj9K
zVKkYBzzi#-Ie$9u+!k~vVbj`mq1(pD&4sUQYb8GHG4?pFVq|!iR$F?>GH(e5;nYaz
z2pPw|iGbVRLsc9QhMlRY%qchp3d(+fVk`l}1Y$~&7iG2M)k{(xUkWIhsFva9p|GEq
zgj>n4`Dl0^PFV~)NVj>4{h{`G9qs&&b<3LdwQyXmL*#vap!IRM%&#^D`1RIrZ4ra)
z^N(6sAM52EBjoS=-5q`4MX=39$Ti;5KKzk6*oP?=!8&L%u4QI)wg^%Pd3M$)n$79Q
zW4d_a44anJv*vhv8Z=-why<Yanv1Ws?<fD}o{mF#7w0<ewO~JCgFYCyrV$bGqh)!i
zbAUMb?asq_3*$R)2G@3ez^0L|0pjLQb?wh@`hC~)RbtZz=wIp{A|?EGcTZkF+_N%<
zZnA56UvZk51AM)i`(^(ItQ$pIT+hZb)6?*xtks@R^$w5#ztT$~+16b>mZN*n*gk~)
z2oZ#FgaZJOf5Uz(m(6C<=H$ALD>o3{KzIw`=Loj|uI96T8~C-XU+Etrwfx=w@4|^!
z27XG8noZ_3oNzthdQtVvLswL^%n#Ax|LZ)PSyntiG&lPZ9%Tc-VPv*;9sk^JKd%`s
z;`fGjkuYx_z6^<cb2#G{F8>mD;Pt()Un}(0k<maO+&&#A$ei>m*|j8Zx*>16B?lSq
z9^vxtuwTUch=m5Q(7<!M2b+e_f>&5rl_jTpNv^pe*W8k8Sq})ID|>-Nlx^%Hzc|(i
zRlYV>b^$-i*v}Bev($;4nA&HMD*!O$p}mojy^%c=tOI4m2pBaxgzyA{Xx0Z4fZ-rB
zhsAZ|evGhIGEu>N-7dh&5-uAEP5{F(&Qx88hhP~+;&CZFm^nR}nVG@Y=snbNPKeiH
zP}A6N@V{pmUmsJLgm(EY3f-|-0{T!-sG1gw!B<HaNX3vFFkcP7B)KF8C}9@#+x+I<
zkMgd4&&X9CuYGQ8HOPOm@BPw$6xa&tL<)s!MA^vh^76xx4TdMHp2_CoTF9IOOy+Zk
z%PwFL;zNcNAt&A)@o|I2HGJ@<!MhQIooZSKUv-gC!=-043`TzFSX@^b`UBq<8LDbJ
zD?u|@9m8=tN#T=0H@}_G@vD;Q8NMI?lzU;v!JMY{v46pTXa`Bh(yv+xA@4}tD^m4}
ywB?Rezbv)gk!qKvi6v>`j?}OsZC#eO-;o;sYR}n7-KA4spf7&>ZxZst`hNkYN&Aoh

diff --git a/ingest_pipeline/cli/tui/screens/dashboard.py b/ingest_pipeline/cli/tui/screens/dashboard.py
index b94a5c1..dacd32e 100644
--- a/ingest_pipeline/cli/tui/screens/dashboard.py
+++ b/ingest_pipeline/cli/tui/screens/dashboard.py
@@ -206,7 +206,11 @@ class CollectionOverviewScreen(Screen[None]):
         """Calculate basic metrics from collections."""
         self.total_collections = len(self.collections)
         self.total_documents = sum(col["count"] for col in self.collections)
-        self.active_backends = sum([bool(self.weaviate), bool(self.openwebui), bool(self.r2r)])
+        # Calculate active backends from storage manager if individual storages are None
+        if self.weaviate is None and self.openwebui is None and self.r2r is None:
+            self.active_backends = len(self.storage_manager.get_available_backends())
+        else:
+            self.active_backends = sum([bool(self.weaviate), bool(self.openwebui), bool(self.r2r)])
 
     def _update_metrics_cards(self) -> None:
         """Update the metrics cards display."""
@@ -353,75 +357,6 @@ class CollectionOverviewScreen(Screen[None]):
             self.is_loading = False
             loading_indicator.display = False
 
-    async def list_weaviate_collections(self) -> list[CollectionInfo]:
-        """List Weaviate collections with enhanced metadata."""
-        if not self.weaviate:
-            return []
-
-        try:
-            overview = await self.weaviate.describe_collections()
-            collections: list[CollectionInfo] = []
-
-            for item in overview:
-                count_raw = item.get("count", 0)
-                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
-                size_mb_raw = item.get("size_mb", 0.0)
-                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
-                collections.append(
-                    CollectionInfo(
-                        name=str(item.get("name", "Unknown")),
-                        type="weaviate",
-                        count=count_val,
-                        backend="🗄️ Weaviate",
-                        status="✓ Active",
-                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
-                        size_mb=size_mb_val,
-                    )
-                )
-
-            return collections
-        except Exception as e:
-            self.notify(f"Error listing Weaviate collections: {e}", severity="error", markup=False)
-            return []
-
-    async def list_openwebui_collections(self) -> list[CollectionInfo]:
-        """List OpenWebUI collections with enhanced metadata."""
-        # Try to get OpenWebUI backend from storage manager if direct instance not available
-        openwebui_backend = self.openwebui
-        if not openwebui_backend:
-            backend = self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
-            if not isinstance(backend, OpenWebUIStorage):
-                return []
-            openwebui_backend = backend
-        if not openwebui_backend:
-            return []
-
-        try:
-            overview = await openwebui_backend.describe_collections()
-            collections: list[CollectionInfo] = []
-
-            for item in overview:
-                count_raw = item.get("count", 0)
-                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
-                size_mb_raw = item.get("size_mb", 0.0)
-                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
-                collection_name = str(item.get("name", "Unknown"))
-                collections.append(
-                    CollectionInfo(
-                        name=collection_name,
-                        type="openwebui",
-                        count=count_val,
-                        backend="🌐 OpenWebUI",
-                        status="✓ Active",
-                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
-                        size_mb=size_mb_val,
-                    )
-                )
-
-            return collections
-        except Exception as e:
-            self.notify(f"Error listing OpenWebUI collections: {e}", severity="error", markup=False)
-            return []
 
     async def update_collections_table(self) -> None:
         """Update the collections table with enhanced formatting."""
diff --git a/ingest_pipeline/cli/tui/screens/dialogs.py b/ingest_pipeline/cli/tui/screens/dialogs.py
index 7a33092..8bbcc64 100644
--- a/ingest_pipeline/cli/tui/screens/dialogs.py
+++ b/ingest_pipeline/cli/tui/screens/dialogs.py
@@ -3,7 +3,7 @@
 from __future__ import annotations
 
 from pathlib import Path
-from typing import TYPE_CHECKING, ClassVar
+from typing import TYPE_CHECKING
 
 from textual.app import ComposeResult
 from textual.binding import Binding
@@ -15,6 +15,7 @@ from typing_extensions import override
 from ..models import CollectionInfo
 
 if TYPE_CHECKING:
+    from ..app import CollectionManagementApp
     from .dashboard import CollectionOverviewScreen
     from .documents import DocumentManagementScreen
 
@@ -25,7 +26,12 @@ class ConfirmDeleteScreen(Screen[None]):
     collection: CollectionInfo
     parent_screen: CollectionOverviewScreen
 
-    BINDINGS: list[Binding] = [
+    @property
+    def app(self) -> CollectionManagementApp:  # type: ignore[override]
+        """Return the typed app instance."""
+        return super().app  # type: ignore[return-value]
+
+    BINDINGS = [
         Binding("escape", "app.pop_screen", "Cancel"),
         Binding("y", "confirm_delete", "Yes"),
         Binding("n", "app.pop_screen", "No"),
@@ -132,12 +138,16 @@ class ConfirmDeleteScreen(Screen[None]):
                     return
 
             # Refresh parent screen after a short delay to ensure deletion is processed
-            self.call_later(lambda _: self.parent_screen.refresh_collections(), 0.5)  # 500ms delay
+            self.call_later(self._refresh_parent_collections, 0.5)  # 500ms delay
             self.app.pop_screen()
 
         except Exception as e:
             self.notify(f"Failed to delete collection: {e}", severity="error", markup=False)
 
+    def _refresh_parent_collections(self) -> None:
+        """Helper method to refresh parent collections."""
+        self.parent_screen.refresh_collections()
+
 
 
 class ConfirmDocumentDeleteScreen(Screen[None]):
@@ -145,9 +155,14 @@ class ConfirmDocumentDeleteScreen(Screen[None]):
 
     doc_ids: list[str]
     collection: CollectionInfo
-    parent_screen: "DocumentManagementScreen"
+    parent_screen: DocumentManagementScreen
 
-    BINDINGS: list[Binding] = [
+    @property
+    def app(self) -> CollectionManagementApp:  # type: ignore[override]
+        """Return the typed app instance."""
+        return super().app  # type: ignore[return-value]
+
+    BINDINGS = [
         Binding("escape", "app.pop_screen", "Cancel"),
         Binding("y", "confirm_delete", "Yes"),
         Binding("n", "app.pop_screen", "No"),
@@ -158,7 +173,7 @@ class ConfirmDocumentDeleteScreen(Screen[None]):
         self,
         doc_ids: list[str],
         collection: CollectionInfo,
-        parent_screen: "DocumentManagementScreen",
+        parent_screen: DocumentManagementScreen,
     ):
         super().__init__()
         self.doc_ids = doc_ids
@@ -244,7 +259,12 @@ class LogViewerScreen(ModalScreen[None]):
     _log_widget: RichLog | None
     _log_file: Path | None
 
-    BINDINGS: list[Binding] = [
+    @property
+    def app(self) -> CollectionManagementApp:  # type: ignore[override]
+        """Return the typed app instance."""
+        return super().app  # type: ignore[return-value]
+
+    BINDINGS = [
         Binding("escape", "close", "Close"),
         Binding("ctrl+l", "close", "Close"),
         Binding("s", "show_path", "Log File"),
@@ -272,13 +292,13 @@ class LogViewerScreen(ModalScreen[None]):
         self._log_widget = self.query_one(RichLog)
 
         if hasattr(self.app, 'attach_log_viewer'):
-            self.app.attach_log_viewer(self)
+            self.app.attach_log_viewer(self)  # type: ignore[arg-type]
 
     def on_unmount(self) -> None:
         """Detach from the parent application when closed."""
 
         if hasattr(self.app, 'detach_log_viewer'):
-            self.app.detach_log_viewer(self)
+            self.app.detach_log_viewer(self)  # type: ignore[arg-type]
 
     def _get_log_widget(self) -> RichLog:
         if self._log_widget is None:
diff --git a/ingest_pipeline/cli/tui/screens/documents.py b/ingest_pipeline/cli/tui/screens/documents.py
index 989a710..4d04e3c 100644
--- a/ingest_pipeline/cli/tui/screens/documents.py
+++ b/ingest_pipeline/cli/tui/screens/documents.py
@@ -4,9 +4,9 @@ from datetime import datetime
 
 from textual.app import ComposeResult
 from textual.binding import Binding
-from textual.containers import Container, Horizontal
-from textual.screen import Screen
-from textual.widgets import Button, Footer, Header, Label, LoadingIndicator, Static
+from textual.containers import Container, Horizontal, ScrollableContainer
+from textual.screen import ModalScreen, Screen
+from textual.widgets import Button, Footer, Header, Label, LoadingIndicator, Markdown, Static
 from typing_extensions import override
 
 from ....storage.base import BaseStorage
@@ -27,6 +27,7 @@ class DocumentManagementScreen(Screen[None]):
     BINDINGS = [
         Binding("escape", "app.pop_screen", "Back"),
         Binding("r", "refresh", "Refresh"),
+        Binding("v", "view_document", "View"),
         Binding("delete", "delete_selected", "Delete Selected"),
         Binding("a", "select_all", "Select All"),
         Binding("ctrl+a", "select_all", "Select All"),
@@ -324,3 +325,112 @@ class DocumentManagementScreen(Screen[None]):
     ) -> None:
         """Handle clear selection from enhanced table."""
         self.action_select_none()
+
+    def action_view_document(self) -> None:
+        """View the content of the currently selected document."""
+        if doc := self.get_current_document():
+            if self.storage:
+                self.app.push_screen(DocumentContentModal(doc, self.storage, self.collection["name"]))
+            else:
+                self.notify("No storage backend available", severity="error")
+        else:
+            self.notify("No document selected", severity="warning")
+
+
+class DocumentContentModal(ModalScreen[None]):
+    """Modal screen for viewing document content."""
+
+    DEFAULT_CSS = """
+    DocumentContentModal {
+        align: center middle;
+    }
+
+    DocumentContentModal > Container {
+        width: 90%;
+        height: 85%;
+        background: $surface;
+        border: thick $primary;
+    }
+
+    DocumentContentModal .modal-header {
+        background: $primary;
+        color: $text;
+        padding: 1;
+        dock: top;
+        height: 3;
+    }
+
+    DocumentContentModal .modal-content {
+        padding: 1;
+        height: 1fr;
+    }
+    """
+
+    BINDINGS = [
+        Binding("escape", "app.pop_screen", "Close"),
+        Binding("q", "app.pop_screen", "Close"),
+    ]
+
+    def __init__(self, document: DocumentInfo, storage: BaseStorage, collection_name: str):
+        super().__init__()
+        self.document = document
+        self.storage = storage
+        self.collection_name = collection_name
+
+    def compose(self) -> ComposeResult:
+        yield Container(
+            Static(
+                f"📄 Document: {self.document['title'][:60]}{'...' if len(self.document['title']) > 60 else ''}",
+                classes="modal-header"
+            ),
+            ScrollableContainer(
+                Markdown("Loading document content...", id="document_content"),
+                LoadingIndicator(id="content_loading"),
+                classes="modal-content"
+            )
+        )
+
+    async def on_mount(self) -> None:
+        """Load and display the document content."""
+        content_widget = self.query_one("#document_content", Markdown)
+        loading = self.query_one("#content_loading")
+
+        try:
+            # Get full document content
+            doc_content = await self.storage.retrieve(
+                self.document["id"],
+                collection_name=self.collection_name
+            )
+
+            # Format content for display
+            if isinstance(doc_content, str):
+                formatted_content = f"""# {self.document['title']}
+
+**Source:** {self.document.get('source_url', 'N/A')}
+**Type:** {self.document.get('content_type', 'text/plain')}
+**Words:** {self.document.get('word_count', 0):,}
+**Timestamp:** {self.document.get('timestamp', 'N/A')}
+
+---
+
+{doc_content}
+"""
+            else:
+                formatted_content = f"""# {self.document['title']}
+
+**Source:** {self.document.get('source_url', 'N/A')}
+**Type:** {self.document.get('content_type', 'text/plain')}
+**Words:** {self.document.get('word_count', 0):,}
+**Timestamp:** {self.document.get('timestamp', 'N/A')}
+
+---
+
+*Content format not supported for display*
+"""
+
+            content_widget.update(formatted_content)
+
+        except Exception as e:
+            content_widget.update(f"# Error Loading Document\n\nFailed to load document content: {e}")
+        finally:
+            loading.display = False
diff --git a/ingest_pipeline/cli/tui/styles.py b/ingest_pipeline/cli/tui/styles.py
index 1c7398f..0095d1e 100644
--- a/ingest_pipeline/cli/tui/styles.py
+++ b/ingest_pipeline/cli/tui/styles.py
@@ -2,7 +2,20 @@
 
 from dataclasses import dataclass
 from enum import Enum
-from typing import Any
+from typing import Protocol
+
+from textual.app import App
+
+# Type alias for Textual apps with unknown return type
+TextualApp = App[object]
+
+
+class AppProtocol(Protocol):
+    """Protocol for apps that support CSS and refresh."""
+
+    def refresh(self) -> None:
+        """Refresh the app."""
+        ...
 
 
 class ThemeType(Enum):
@@ -181,8 +194,8 @@ class ThemeManager:
     """Manages theme selection and CSS generation."""
 
     def __init__(self, default_theme: ThemeType = ThemeType.DARK):
-        self.current_theme = default_theme
-        self._themes = {
+        self.current_theme: ThemeType = default_theme
+        self._themes: dict[ThemeType, ColorPalette] = {
             ThemeType.DARK: ThemeRegistry.get_enhanced_dark(),
             ThemeType.LIGHT: ThemeRegistry.get_light(),
             ThemeType.HIGH_CONTRAST: ThemeRegistry.get_high_contrast(),
@@ -1106,18 +1119,16 @@ def get_css_for_theme(theme_type: ThemeType) -> str:
     return css
 
 
-def apply_theme_to_app(app: object, theme_type: ThemeType) -> None:
+def apply_theme_to_app(app: TextualApp | AppProtocol, theme_type: ThemeType) -> None:
     """Apply a theme to a Textual app instance."""
     try:
         css = set_theme(theme_type)
-        if hasattr(app, "stylesheet"):
-            app.stylesheet.clear()
-            app.stylesheet.parse(css)
-        elif hasattr(app, "CSS"):
+        # Set CSS using the standard Textual approach
+        if hasattr(app, "CSS") or isinstance(app, App):
             setattr(app, "CSS", css)
-        elif hasattr(app, "refresh"):
-            # Fallback: try to refresh the app with new CSS
-            app.refresh()
+            # Refresh the app to apply new CSS
+            if hasattr(app, "refresh"):
+                app.refresh()
     except Exception as e:
         # Graceful fallback - log but don't crash the UI
         import logging
@@ -1127,9 +1138,9 @@ def apply_theme_to_app(app: object, theme_type: ThemeType) -> None:
 class ThemeSwitcher:
     """Helper class for managing theme switching in TUI applications."""
 
-    def __init__(self, app: object | None = None) -> None:
-        self.app = app
-        self.theme_history = [ThemeType.DARK]
+    def __init__(self, app: TextualApp | AppProtocol | None = None) -> None:
+        self.app: TextualApp | AppProtocol | None = app
+        self.theme_history: list[ThemeType] = [ThemeType.DARK]
 
     def switch_theme(self, theme_type: ThemeType) -> str:
         """Switch to a new theme and apply it to the app if available."""
@@ -1157,7 +1168,7 @@ class ThemeSwitcher:
         next_theme = themes[(current_index + 1) % len(themes)]
         return self.switch_theme(next_theme)
 
-    def get_theme_info(self) -> dict[str, Any]:
+    def get_theme_info(self) -> dict[str, str | list[str] | dict[str, str]]:
         """Get information about the current theme."""
         palette = get_theme_palette()
         return {
diff --git a/ingest_pipeline/cli/tui/utils/__pycache__/runners.cpython-312.pyc b/ingest_pipeline/cli/tui/utils/__pycache__/runners.cpython-312.pyc
index 91f9b8119d79f0abcfe3cd94f6799bd54ebb0be6..cd7f620376e698eba173fe724098816d5cc8eb5a 100644
GIT binary patch
delta 613
zcmdmJwo-%dG%qg~0}$xSoy~Z}w~=oGH`6Mn$qTqoO#a6$ug<cX5hTgLz{rron!=XD
zp370o%*epRP{Ulql)?^zHH=w8lM~s5nHjT0K(snzmKa12GP#ChH9Le~%fiV}!;&RA
zIgv$pay<_hBm3lE{JOlH2%Bn{CO5K)Os?bMW@oQvW?-1cG)X{Rj0>TllHHu4#~p}e
zlqV+&C}7tMH20N&z9f>ia)t`#NQQF8wan#=n%t9(1Q$3|+4&@v<|Suj=A|oygnBCI
zDioLG7bT{rDkLQ)XQ$?+6f2Zx=Hw`3=4F;-Cgx;Tr2?5?x%8s^(!7+(tA!O9{U)Cl
z&SK=7Y$l@0#++DCP~<jQR#cObb+Wst4u6pw(A!0xK%$rxNK6(Gli~IUGC;VPlX0@S
zn2+KU7Or;hM(+y(0asW8zp^o~>fPj0yul%UgM$ZxCSMRwVdR`_Ct(%n2h`W(r0FWm
zct}Usg`44!J);Xd%V7o<Ap0<j22lL44x<Yv%VAw9Ao~bABT)PZCnJc>t?4Sje8hy&
z#hl}asWgy%RDju4c=9!gX^j4pb0y_igMnrjPM#oX#TYvIw4@Sa;N*9b#X#>RN$IG7
v+*<@vP$UH+q(OuXkod)6lbfGXnv-f*6gzp7Q~|#{qa))N7e*#VWw0UuZj+3h

delta 2160
zcmah~Yi!e26u#GS66gJDo0hcHJW3mALuspa6#7WoGSWbbcvS;R<tC<eaGhd1EzKOY
zW79?@G%8txzx>_GB#@Ah_G@T=cuZ5W6eU;;?FXColWic4{g`&0#-(V|xKhqN_nhxM
ze9pNyUpC$Dv_G=h%m6Ll<L{?9&u#m%1^Zkt->}@rB`o2PDcmDRabwlTAdY{i1K=8V
zUH7S84>CGQmvCun_aGQM2*4Q(fDE3|OL~5b{Ewwxub1$ITLpQMMqLnG@r%S74?v<)
z{#{>zYarJf&@c{AcyG!7Gn{Z4B!keu!LSAydZ1C>Z1qDzrE=J2!RB!_YK>X+X%QsD
z3S8skmPDOublUm}kPL%hr3}&ZE9m3Y1wq^vx3i9EXU16K9jt5Gogtu_P~#eABNdyp
zQ(~u@?yhpYjOm^D=C|<Xcj5yop4R+Z#64PM$s`dg<>K*}Wa3~P&saC;&6070-dxh#
z;?B5>t(o4Gu|t3X$u41%RkBGI2_`ya%HYw##Cz)A2ov2}q&NFb_lj}tlyR7V<Vf_C
znuTTsS7$}8wY4}rT5(Io>w6n8Yip^icmtTnyTCGb1$2Qc!{}GP4XC~Re-{S(?wSoQ
z=D<bW2Vf3<t($}XN;zu3u@FtyGzerY$#HZ{q~oNJip6L_IG1AC`E<n_6_e!1a}>kU
z@pRKbGR4M8E-7kuq?jZrZk`mxBu`D!<OCHvPjm5f%Mq5Q1e%OZ(XsR7d@{wW7U!7B
z6i<n&M{0qKlOjJ)Qj-+JrJIkXW@eJSnn&4%&`plg)GR}ZbTc_JLvy3_#EEb-d9>|l
zdix<N#l@x=ZjwBHB23OP;uP7iZrLRGyU7M2jWv_8@<f!np-w?Nn&Lk@5EEHI<9r=R
zV9bdwCPa;0>)2cL8oUnCwRGcP9+WBvqkgF9XDK#C`!NLzv?@j|UDZ2D^0jFD+q8d@
z=IDzvd~bRypW?<v`l6Vk*l{t%1opGZ7{v;`X9DXW4%rA5i2MfrS_D73LO0%DZoJ;|
zMN7^VdM)5cajB{r^6FcJ!aLWCacr&VNaoN=RTjws2Puy@5|EU?aWpJ=8IBPdie=LD
zIK{H#TF#1|5$S1xKY%>*U5F@Ele9Qa&7yWw6D+*}Nb`J>S9C1RDR?5uaEhzk@<0;x
zW{#dnG5oOV!KumT%H8851FGDjdM*d%ZK{MA9SWWd2agXa=8+>q(ecrt(2203Lk(8U
zjKFY$NO3V*(NQxq{9*YQhaWm+hqHM>v6tP9BZQa|c=Wsi#aNzS#r@y(OPTSJQhHii
zS}uxf{R7rT7QT&NKM<OQVk#jwm%jBda>kD#BB1#}jbC5#u(Q^39?3>jWiKXQa2{GH
z`gRt4p`0(2_YD>*2N$C+44`gTp|&+w+nTR!`vc(m5X=$PmyOHbCl>cptNUtXDUz*j
zzcqSy?Dp7W>%em)iY`U7zCE|P?)Kd7d29{7FsW8AtYDMBP}7&I>C4vyvv}1LOWjk#
ze$~2U%~tlU68-3~aMiM8$yN-k5`(I$bO@~y14Y9A95;U!`6yB(0#6A`*19=Q)E5cs
zRnw9Q4PSP5aMcyc6QP$zTyJ<~2l}p`@Q$CoI||;moVV>xZ=roS*FK#0MzVNCvAVHP
z-JYv%zY{HV9L{wd&R0jXcxBPOr7+@d$+=r@a)m&DF3_KM2NxqR4Pbj98|eMkvAXR@
z&QYH|d1~?C(}vyI)?jwv*lNS^oO4U|)Y--GD+AC6o|v~332%{b77168@W{`caWi`D
ztA^m~7iXY6;Oahm8kPG}up^>}_c~#?6TjDWU>iEz_j$rS;C=vx_u}_=<0{|Ygyau=
zFuV_cQ0r6qy%5PC?1L)b<Bwpvhdbb~pLp2lL;NF57tzZ<xUOwiyUK4;iTWp6y6TE4
zP6<;JNs5p2NhDmBFT1<p1^GMoRyZyH>K5RHe9F^oD48bZE1o(yFMs8karD9<d>O(p
IxUJ;uU$u=taR2}S

diff --git a/ingest_pipeline/cli/tui/utils/__pycache__/storage_manager.cpython-312.pyc b/ingest_pipeline/cli/tui/utils/__pycache__/storage_manager.cpython-312.pyc
index eeb7c6ff388462b0f7984cf42db24a109a5af019..e62a89ebc709b88272f4f480e22dbef87bb5650c 100644
GIT binary patch
delta 5511
zcmbtY4Qx}_7525Cf8xaXcjEjz2@vcMCxp@wl7bz`ACS-_{KX_Vj{Oo0es;L;1xOYa
zrv3~heuQpSs%;hhrKNPzkf*NgI!(0eXuEbwC@t(s6?9Uic3W4fYE#>7+RnMpPJp%3
zq&>lx^Ugi@-gC}9_nhPR{;TB4*GcAYZ8ob8o&w)HyI<)$mFXb=I8{?SBbohXq6?F-
zF=~<0{ArTaZ{_c%Xu6c)&j8vSwnS}GrazO@Y0)ex+n+7v_;aLOe=hK>;q+*pl<&`%
z?0!3!$%qz6h5kZL+oBGs$X~?i%xJMx;xFNJR<u+q^KUOBIx&r!V3X`<xm4k=AUeIS
zLl@4uUl-05t>+D>vrgxCa&8`Q^Ton>ZYAg1fm?81pOmbcG`I?xgKQ`@sF^-_G8XC(
zV<HVIajK@Ri_`do5{ZdSCW~z@qNeqWAu1~U3QashR_jSAd)LtCE{3&e34lva%aE=H
zkZ}j6la|9D)fkFT#FVL0cEM1X&1o*@gfUvl_6zQU`88-MFl7P&bJ+{Rnsi)&IuR<_
zzXW&3yr|2_w^NP#CPX@^8lw>@qNr)gZYs*V<I%9DhY^>;M^nWli$NONJynLflxi;(
zAR?y&e60KOu<mB2&RzGFrdQScX1D1DqF_@rE{mE?>p5Km?4+VVoztr(@YMv3sX|XY
zCY}?xK3`j9g*vC5$f6CnkRcLN&gp3b+hD4!b#V@eP&cl27eX!ajHA(bP~l6^707L1
z51aZMQFXc)f$zQyDGvgk#~1Kl$IYe=q!5Z&iFwrI<*$h!nCJAQj15>fnYfoXvGdkS
z;$iPt!?wB=M}%XU*A~}4>wA2Ftw}E>UN&5q&*JIPdh`k$b{DRK8i4xzKzo6{_2Bv7
zR5|;pHJ_DdSjk%E%IFfRKq_$}|82bqsZR(j`}F#ALJ!5)E$uG7YLp@VL^ZALU`QNS
zBJr3@pt!bb5D$j94^&Gy9-5HEm?8@>;B+274B@goyN`4w?$0hH=_pQf5gORpoW|@8
zNcsU(LsX2>F7|QGQqswCa!Xe1M6R$W9*I#50#}x1%n;7NP*$zuG$IA*WFQizyO7(<
z0=auNm-*RjZaG<(_$+s?!0n;i!Je~A25=?4n$9f=j0Ba?Zi*WvEun+BPBmNRaPW21
zVs_F|%)*W~vX4FI7|IFY_%Og08bor0If`~iLqNK0lpAvp*<l2J4kA*c2xADl5jqhf
z2)H%fgK(>flgQvErZ1Q%(<x;4GE%w3O=YAN067c5IXsM4DfMWvg^Em7@I$`0IGsci
zgT+Hcm;mm=DQjM7NqWT;7NepfeuG0`lA4}6TJZO+r@ODBmz-v=RrtTbIUeW0%&pG(
z9xU{KI%fu#;LgcPIY(1FOb_D_kFY3G5<-k+R~G(H{zBcRin+heRG7%A#7N};ArtJC
zs_z!z6@Z(?4;Zht%aBZ|?B42PE#ell@#=E&b9S=&O$T0jh%)n-s00;A8aNN9u<=DM
zO}d7iS>z(WU~ewE-sgr<o=vz}sckT4xJ=qMn0~a(gGooTUWh27B%9z}J9h2RaaPiZ
z%q1rB>XY^*qzE%lDla^MbW;0X=BX*r^znf9#YRk>mlKhi3et#jv>SoPtqmyExIY+$
zoZgSz7Jy`?*Ia&_y}Z<=RRs*~DHnLs&J3=6a*a7$-4-uS5NHpRTqQG@Vd-*&dSsg@
zzttJYz@ts3QlwUE<9H>eGNTb$*||QMVTSG$y;~FI0fN)+7*~ancsxoQVPp?oiR0fv
zXaY#xel0N}mv5WJt)%xLV-3PugiQz)2z~^9-+5ePVBDGSBW$1BUW^{&#nY>uQY%U#
z)UwCiFKKDNH4&(No)DR3)K%@`Y5QTEr3XkBNxt(`VLv3{;F#DQi~&+lAP|W~ltADk
zly(9f*4?ObLy@puYrcp7>F7ElT(J~gtExF7yk{w*UUsam2u|f}-3Iam`@C*ipcRUZ
z<#;OC%cXg&)NUz=k+42&cwRV<Ssb22!n9#e7Mt;GCE4uU@(P1-ny^!za%QhDVT1Mg
z`WKI~8&w7D!TLNs#Wn4ufL*9>VV^b>B6DE}c=_);l)=n>%PRqWEAkA2;=ui~U_S+8
zoj-dDn4!LosSWd+m9pg?7ckres!e^KA!!f1eSb$DE3=!w-J&vRmvFz*<bF=vulM%-
zu=%;;!T6sx&>afKD}Sa9VN=)`At%Tn9NHn{A(Mg;!Jj=#aP?kn5iKZjpDwKbu0f}J
zSby5^pwXy1WWHq`<Fq+!d_FDJAg<R9!Tx+r%b_#{a{+&*(-b#5)L57Yx=veApJU~M
zE^Ilf3lt=tX?$9Lj|e=~av%udF&d{@%<{s)Z?k24n{Qi}Z%Z4^K{?yDwsl)J_XYaf
ze0}RW>1lR!WorR1jYc(NBpBK&#=-$*a$Ka{?8B9LcAjT3PGuti<{&KfX?JfXHxmPQ
zw~(10)f^T_gA-8&uGev{3M?@W^;}WS!SP67uQ<uCXuE2H&MFd8=rBlaaS{3){B>FA
zQ}BnPu393>MCxgPsT|Z}XKPRvlb2zL_iXeO47v&_UL2L>ugY7-r|=aXMPBv+F}Obx
zRK!4P|1@B0_1MmOR@H{j;Cmj*X3$0&NGVJoM^-wrQZw_BW0;DJQ*`q!B_5Taj{vx=
zTK1NZaTXzp(9J$r)kvOV*-cK2)~5B&KLcBChoJeAce*z`4M)s>6*AMxZdU0wl5WCS
zQ?0YD>(bE0p{s47%Wa__r#-glnYzd8u2y;Hs=QYmzS)SxHm@#ZA2y9R+c#X2E=pJ1
z#mnvDf}n4%%6G-lI=eRxf|Ap_{*vvY?W%X+vUgxXsCllc`HG`uHW1>gU0>a9_jO(>
zzgRxoJ3Q-~oK+6a`6jP6PqL=w&f=CS^0kZ^^S%x4jc)Q*9oe{4c+1ng(anC;yuTa+
zO*KFTgv!Iy8J^~RI%D-M%gAyz*y1GK#G#gHGSddb3$=!J;42T-7m-?zZ~}ohPnbJh
zW^G+A)B_AvkVWVrd8o}ttQeb+c!845AcA2E56{AC$;d<`8V*Php^*SPxTcw`WItQ;
zRI;I#)*dV5HV6=>@@>B}Shly7w6T6~HOL<DzE^!372|s5pdQ9nUw_v+t}cW=H~u(_
z`)c60Px~547kkU+1G6()Z33xc#qE72)R``3w7to+7|G-8LVI!l8$i0UxffI;FZWt`
z;T4%zI22Y5Qt%+}A60WSJ~kGKjj84XK^g->a~bb4e}(IIvht2aC8&{_8Hz`vVhG##
zfD|0pE?X}f>L|+NC73TwL^_M}-e5;ND#=N9zGEpEaiyb$^dxdRGldR*xA1aMykHcs
z5B%bb9}sEEa=sWp6KgCei2**C>>pEw?J^tPw3HlUCpR4cznHrh>33jL1pUQA1T4e#
z`Qh`Vl*|sj$mRX=4WxK0#k(a5U(rz60)U5p7#_$__igSY=h^$4YxNC{%y91oaTvz8
zfVK<SX1+UtM(HAqF5GZPO8hwa7JM_V;2%+lpCP~DxHsQ+SnJE7>a(KWR&pjW*t>(&
zF4$zldE9&aNHL|*tvESV_1X2lyT~gnzrP9m($nwNXH>!P7Wyno2H6j{*3a<R!}oU3
z_A}&D1Z2B1HUIq%88rwzxWcLNg^;DMA@2c%ZUi1N7-8@ud2>&jD@`-|Z5-o%;(osg
zudH*MEB}2UWK5;#Xa0c24{Td)x=3I^V6SiciGC|d$lDG2MsEGPxR3_{cfud-@bjPR
z%roa5PIz`;Dfu8VH&8)xFt6Tz7s<}Xl234(Y#4&i1SVZ}{?#n!T$Xdz;)GtOXXp9q
z-{35~n)C^PR6@c7Tkv%0;0E#+Ha57p+KVy*uOhSnXsxy^M=pF1fIrY+SMIV8U^_YV
zAAvKKdrMtPeo+7+G<(X?FTzKWSV-KNtXr*GT}_rRp4IS^L)lPiC2FS?zh5K8wda9(
z3SLnW<{v7(hu<!q3KrzK6!Ji775wResO166<#^Qc4;V5_3{{%AL5t8J_SsNw34hJ$
zYwSyEn6dyjEZx;T!~1p34O+R?YP+WCf_{15-a5a4=DdXPON5IE{D4%XE+hO2;Zuaa
zA$$d(TE=O7Tx_DsB>g)w|A|n7;6*4$cqj#b078Bg;C|ij1>YBf(YTaV1|H%^%cWe^
zyqQ<6fxzeld<_x<0cyb6BD)qSpP?q8RTH!sm_)I1P)sAB#AG-aQz9XX(XM8N;CqM%
zK7MGQLu4%rr*p0pho7Y~&A_=fgiM@aO0u(&gJ-H{$XY+|8G&|&e;QG9>QX$gICemU
zI;Hg_c_}_LBAz5o^Vx~vf^Ivm1^UEBBV!&}RN(vIn5>1b1NXw%()@F~&%U;_fJzfl
kaScs}TLk}fa)^CCY`3nR)2+R(bAO~OXVze+;DwQY15gD5ivR!s

delta 5279
zcmbtYdvui55#PJ->}K<RY~C9JCL2gX0s;vnW)mS09+41%EQDpV`z0*dN4Vb?A~6^^
zSVci7y*@yXrB-W8p|zgXdaSlSPHRhREvXOivp!C3tyb&NV?9*t>FLaTy9wcF|LJ$&
zxAV=Nd+*HLnYr`j!C$f0o@Z&lb2w}|cs5>qaYx1aV`)zI(Xq<86HFImK~vZgv3jkM
z6mJT=n}e3HEn@fDiMEDQBMz@4lIBf|q<hnWmlCvvGa{MZ%t)3ui)8HK>`0C`hv?LB
zZY0l}N3<iHA8~q}M5l!dB8A>UrjxAP411)9iz3C|j$)?M>pFD7jGJ}AOey8G0d>^r
zyd}iV0&cdHGsP_>ZVqsBPwNwsWqS<nJW<6uGxchkN8S?+bVyN&`;{0MN7$VBv#d$a
z3dNU(?ouaA;ROJ0JugDK96-i}TrOTLhKyBqVwd7rnfSJ`I&W$UFGN{}vLO1FvBh4D
zQVG#YQ?+AC)NSHLVw<TXgO)ep6ntRXAyai;39e%YcwhIgeY#K5bk#Lq{O`@|<|_M~
z%QkB<=k3I$FWF>;yT)DXVqkAAFjPY*s+`gjeJLdzl9eqW(RWJ!0UrI}06p(rbIQgm
zNg4)u6;QkZ!HqoAKse@C$T7SgxwYaK<_!&~G_OD)MXHgShk)Mv4F2mlxg!rLgnZF%
z88EldYy1(*q@ERt{kAn`lIj#M+sfHI@wqKnUFbS!Je+pHS$cfei4-6mf3iAmvrJl@
z$8%1WoG3Y8P%~Lj^QyI$w}|2N9C435T#b%~6YRjnQ8BQXj;#ymsneuEQIlH1n#KCm
zRm>H?FZB<4<`P5cKL#w!D7K@#YLIRS@N(hF$Y;f(H=~<%#LoatgFFLQsTD6}He{?s
zax={cOHtk-GP0`J3elKVw4fKc#+|WHl&1jcPS@1gf-~@(RNF8QMf`k^FBIfkk=rG1
z%^K1I2$viy5J#K^%oESg9x|F;C~-Yl`@L4a323)owaXCAlCR&d1a@%T&TZtVJ@+Ee
z9x1_CU?d_%6<Ia{)8*Q?4+1XY46>N`qq8rw4<)w&^l%@N+eK@^jtM`IZU-mhb|bqV
zfjk>PDu^H<3?QsP7(_rN_zr~2O&&!CsbiluS>`t&oAlj@)DS`#K~$BOh-(XTwXoPN
ze1)^wVEpF7KE`A^ugjb<E9ne#Pzp<m^c8*(H<cB_DV``>&+ZZ*mU+Lz=#8%48Agwz
z8vmcsdvOUeIz4H$reToZghN*vE@qdPPa8chO0FufXcLacZ!hl!)5TwA-Pq`Yxe(=a
zG?;mA!*tD3Qv<P)sN&<2JQ7x9ESgkc;Fnj3;}xasaq&dOStlkdgpXxVQv3=eJ1&On
zh~u-}n$PEmU(a^4C&j0;-(FjV)3FMWHOaj(*WG4q?@An;DW)1jiWHH}Faj#TqZNW`
zFsqC``(X1`tOpB4GG7lMov?)R&l(8FWXU%WooNNm87o)|)`d1e?E42LPtZRMr(R3)
z=i<jI%UA=h##bXyjAB()O}qW!5s9xyZW91jW2EUA4v9ZkB`hBlneJNlnrL;eoxnN;
zDYXWE#&S1EyGEpFK-$vgm!-t!eN<C<9WGRZ!e&nCjdhj0l_-|@x<nhtTo_BEB7AKk
zHT$j<U8sppPzd3?D+E+ye=HW}^KoPW!qo_i0g?qkt5C?LZPUqQz7!eD5SkG>5lRp?
zBT%AK;A31tMF$~{$E=lf%x~4<^990wSq@0yu+Qga<WHHwP^)&pttgM+7Qd-}Qmgc>
z@muGfVQiOJSTif1oPH+=%qYp7B2rVl{9R<b0QTwLapDEwxUjUDemYhiG`?ajxKLbv
z(D<sgfaA#oaNFc#1p<zpeU>F&s_A6=#jg5XQCmBh71W<GoW{}z&tBuWVW&fQ8cJX&
zTf8wpU4-khjpIfoO|behW)!}<rQ)&cv-SKQ;i=6R_txbkmKvL%Eo$cH;~@RsTbKQH
zOQR?*4ZpZ_9xiP%jx)t9cFivq6Lm$oPEDW7k(0{Mk$hU`W==$LOa0gF0b;&}a=`r!
zxvUg7NT&^w3+^lwb@h4k#tnS4f+dKaaYN7)G=|s_wiSAty{5fp1rM5@owG%KY4!wm
zU>1}(pbJ`WH0X49>+dn#VlwIWS}t41G;RqR&rCIC*XsI;bvjzpx;I6^VnEM$ih?zP
zo@86b_2Vf~76fI-tr&=hOO3jq<u;u!7scWy7CfMD4gjTENBtqiHxT1mfbIewr#!Z9
zTJG7n%G0x)r=y%><MQ^Nu5RCk<(}^LmHaL-x~Q#%u0oTV+V2kxNztHB*)uFrJy0EZ
zV?x!?qF76Qj7Zr8fMp7A$BT=)*vIjX#mksOg%UjAhjIgnbx0grlD`Svxk5EVj}!_h
z+ReER^56%+c3b&(;fM6p%1<i3J_s<Di8_2m={Sn>^7x(NKTGoMB#u_{`-H18&rJ7f
zw(vC04c?F3OaL{NH*g<VH4Ke~!cQX0jx7Ih$TuYI;aSKrjD?0dI`Xos8n@zi1GsHk
z=^H}ELkK$&R*Q3u4V7qtYFGU7Q1TkVVzwQ9Ll337nlIKj<%`y)D)ZlARJMp{Q=UFE
zTO4efo9Zk+={Vsy?_4zLTqIs@+B3yiJn394!b>AljQUAuz4&5jUru?|_e&or{Ylxm
z^4@bjn<vYA&lmNIp=B!zi@ofUj20bOW$CoAvo_XgGM=?B?X-yBFWX&;VWAq}8iRX;
z3JYpKRak_-c^<11N19!%CH_eBIGbpP;psbpFUMC3t)C**hHw~x9N!9*+oG*YLU<3T
zMp=SB?+}tx@g+q^A{0xq1^6=@Rn$Kc3I}}=ys>=Zhu17+3&eZZJjArN^<?YeVzR*q
zCnwMNmcR}2MAVZf`aG4aU3|k+LDe*15Z`Rg5zl*`uDA<iIB8C)U~2PhSk+DjK(vxO
z4v7caDxvi`+t$E3#J}4-;E0xXhY>p6H67h%v;rD~hdLT3Dv%_rAhi9;h^(eUomYG#
z!$H3y1^Ejw?#>`*sV2JGwU(bQSh}Kc1=SGo-$1ROY6-^%2Sd?8)iUbmQ6MzWQiJ$&
z+zfrJ=J??7e1VwQy3$#MDywOMSU4;Nlu#_{i};7NjOr3cR~BSr>e1JR$|U|0zPuow
zT3OES5O1!m0xQj{ma#SQ_El-d4m*xwZt(jMFnd%}I5sNrq-$s~GT0XNM<gE&CVJ##
zw{lJ#Ut7g)7tgI7wcw4jE?^XoUX>Hyu+FC6jI|A#i0Sa5tCAvz>QAB=bm9Kg0KbJ4
z&Z5sOt=&bFWh(#%%|3Xb{5*bLH#;S)>*wlSv&7ZwAC<Pjcn|13U0m?1j=B!$nVvy<
zD%GI|(aBG@WTfExC`89isXhd+wC(oo+i_>Oyv6G7Hg<pfNcUzociN_DKhi;CCh`q9
zSr0(pu9-ax+0Vp^o<<0*eLb!ER2Pi&@P`4pPrSIXZi2!T-&cUP|3LmQ0<zs{n*Uxz
z#vBBS!~W#>baeCQkaqxKH3G#E#+_<h*R^iBJ4G}5w>U<ABENqOuVQSIJLeT3Wc(yS
zYv}=tpV-u7eulw-L0sJQBQ`7k@MeR)fsCKTb><=9Mye?gmi(MlrV4t658m)ru{Ywz
zEoCed>+6g>77MpF6#Wf%!JZ7h?9IB2ob&0f$#mB_s|!9~_isI2@k^YANzA_kkSu0+
zUek{5>g!}5iF^Czlwv4CIA9aSa}cJ(0Y37@n|-tFmxYS3Z7ZCIMvXbATG&MU+NRx)
zi7vJkWMJ!Baox7!a@<?H$eu@vbfayKCZ+D!R@_WUMA<(rPg2N(wHCq8ItWRMMv|lW
zZ@?vYiTAdZvsz*G%`3t=W0~Cz-3i4Kf4v}Wx_oOVsJGVsfWb)txQ%fQJHoVD*<au0
zK8BJ{AUuUYNkd-0fUoBeK0x>o;hzW>0aWWSj}1$WT-n3FK<1YS1qgTuTFd(_q!8YL
z|1y@En{}@nJ)ap(rdgtA`<)deiUMvIHQuVt=NlMNM&Q%k#|^;e0b%!-PN-&R60lO5
zk%w1_njU};{95>1gfxs5QPyg!ow$)0d>+c&hQj2CRGeW>u+xx@$EKzxdY;;T_;8`W
zU8tE!78n;DmEewo-a<U>cTQyCjEv;)sN~-rg8I+1kqyd32SS6jvZN@WrmO{D9&Xf%
zK#rK{oJ-bapwCEHYT;JM0r;nr`v5*MFvecjE&1H6V-@e}(%#lBd|OxjSDonXUtvUl
F{TB+zu;c&$

diff --git a/ingest_pipeline/cli/tui/utils/runners.py b/ingest_pipeline/cli/tui/utils/runners.py
index 63d9400..fc629ea 100644
--- a/ingest_pipeline/cli/tui/utils/runners.py
+++ b/ingest_pipeline/cli/tui/utils/runners.py
@@ -86,49 +86,18 @@ async def run_textual_tui() -> None:
     LOGGER.info("Initializing collection management TUI")
     LOGGER.info("Scanning available storage backends")
 
-    # Initialize storage manager
+    # Create storage manager without initialization - let TUI handle it asynchronously
     storage_manager = StorageManager(settings)
-    backend_status = await storage_manager.initialize_all_backends()
 
-    # Report initialization results
-    for backend, success in backend_status.items():
-        if success:
-            LOGGER.info("%s connected successfully", backend.value)
-        else:
-            LOGGER.warning("%s connection failed", backend.value)
-
-    available_backends = storage_manager.get_available_backends()
-    if not available_backends:
-        LOGGER.error("Could not connect to any storage backend")
-        LOGGER.info("Please check your configuration and try again")
-        LOGGER.info("Supported backends: Weaviate, OpenWebUI, R2R")
-        return
-
-    LOGGER.info(
-        "Launching TUI with %d backend(s): %s",
-        len(available_backends),
-        ", ".join(backend.value for backend in available_backends),
-    )
-
-    # Get individual storage instances for backward compatibility
-    from ....storage.openwebui import OpenWebUIStorage
-    from ....storage.weaviate import WeaviateStorage
-
-    weaviate_backend = storage_manager.get_backend(StorageBackend.WEAVIATE)
-    openwebui_backend = storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
-    r2r_backend = storage_manager.get_backend(StorageBackend.R2R)
-
-    # Type-safe casting to specific storage types
-    weaviate = weaviate_backend if isinstance(weaviate_backend, WeaviateStorage) else None
-    openwebui = openwebui_backend if isinstance(openwebui_backend, OpenWebUIStorage) else None
+    LOGGER.info("Launching TUI - storage backends will initialize in background")
 
     # Import here to avoid circular import
     from ..app import CollectionManagementApp
     app = CollectionManagementApp(
         storage_manager,
-        weaviate,
-        openwebui,
-        r2r_backend,
+        None,  # weaviate - will be available after initialization
+        None,  # openwebui - will be available after initialization
+        None,  # r2r_backend - will be available after initialization
         log_queue=logging_context.queue,
         log_formatter=logging_context.formatter,
         log_file=logging_context.log_file,
diff --git a/ingest_pipeline/cli/tui/utils/storage_manager.py b/ingest_pipeline/cli/tui/utils/storage_manager.py
index 28ece27..42313e2 100644
--- a/ingest_pipeline/cli/tui/utils/storage_manager.py
+++ b/ingest_pipeline/cli/tui/utils/storage_manager.py
@@ -4,9 +4,11 @@
 from __future__ import annotations
 
 import asyncio
-from collections.abc import AsyncGenerator, Sequence
+from collections.abc import AsyncGenerator, Coroutine, Sequence
 from typing import TYPE_CHECKING, Protocol
 
+from pydantic import SecretStr
+
 from ....core.exceptions import StorageError
 from ....core.models import Document, StorageBackend, StorageConfig
 from ..models import CollectionInfo, StorageCapabilities
@@ -54,8 +56,8 @@ class MultiStorageAdapter(BaseStorage):
             seen_ids.add(storage_id)
             unique.append(storage)
 
-        self._storages = unique
-        self._primary = unique[0]
+        self._storages: list[BaseStorage] = unique
+        self._primary: BaseStorage = unique[0]
         super().__init__(self._primary.config)
 
     async def initialize(self) -> None:
@@ -226,10 +228,10 @@ class StorageManager:
 
     def __init__(self, settings: Settings) -> None:
         """Initialize storage manager with application settings."""
-        self.settings = settings
+        self.settings: Settings = settings
         self.backends: dict[StorageBackend, BaseStorage] = {}
         self.capabilities: dict[StorageBackend, StorageCapabilities] = {}
-        self._initialized = False
+        self._initialized: bool = False
 
     async def initialize_all_backends(self) -> dict[StorageBackend, bool]:
         """Initialize all available storage backends with timeout protection."""
@@ -252,14 +254,14 @@ class StorageManager:
                 return False
 
         # Initialize backends concurrently with timeout protection
-        tasks = []
+        tasks: list[tuple[StorageBackend, Coroutine[None, None, bool]]] = []
 
         # Try Weaviate
         if self.settings.weaviate_endpoint:
             config = StorageConfig(
                 backend=StorageBackend.WEAVIATE,
                 endpoint=self.settings.weaviate_endpoint,
-                api_key=self.settings.weaviate_api_key,
+                api_key=SecretStr(self.settings.weaviate_api_key) if self.settings.weaviate_api_key else None,
                 collection_name="default",
             )
             tasks.append((StorageBackend.WEAVIATE, init_backend(StorageBackend.WEAVIATE, config, WeaviateStorage)))
@@ -271,7 +273,7 @@ class StorageManager:
             config = StorageConfig(
                 backend=StorageBackend.OPEN_WEBUI,
                 endpoint=self.settings.openwebui_endpoint,
-                api_key=self.settings.openwebui_api_key,
+                api_key=SecretStr(self.settings.openwebui_api_key) if self.settings.openwebui_api_key else None,
                 collection_name="default",
             )
             tasks.append((StorageBackend.OPEN_WEBUI, init_backend(StorageBackend.OPEN_WEBUI, config, OpenWebUIStorage)))
@@ -283,7 +285,7 @@ class StorageManager:
             config = StorageConfig(
                 backend=StorageBackend.R2R,
                 endpoint=self.settings.r2r_endpoint,
-                api_key=self.settings.r2r_api_key,
+                api_key=SecretStr(self.settings.r2r_api_key) if self.settings.r2r_api_key else None,
                 collection_name="default",
             )
             tasks.append((StorageBackend.R2R, init_backend(StorageBackend.R2R, config, R2RStorage)))
@@ -293,7 +295,7 @@ class StorageManager:
         # Execute initialization tasks concurrently
         if tasks:
             backend_types, task_coroutines = zip(*tasks, strict=False)
-            task_results = await asyncio.gather(*task_coroutines, return_exceptions=True)
+            task_results: Sequence[bool | BaseException] = await asyncio.gather(*task_coroutines, return_exceptions=True)
 
             for backend_type, task_result in zip(backend_types, task_results, strict=False):
                 results[backend_type] = task_result if isinstance(task_result, bool) else False
@@ -426,7 +428,7 @@ class StorageManager:
             storage = self.backends.get(backend_type)
             if storage:
                 try:
-                    documents = []
+                    documents: list[Document] = []
                     async for doc in storage.search(query, limit=limit):
                         documents.append(doc)
                     results[backend_type] = documents
@@ -455,7 +457,7 @@ class StorageManager:
                 for collection in collections:
                     total_docs += await storage.count(collection_name=collection)
 
-                backend_status = {
+                backend_status: dict[str, str | int | bool | StorageCapabilities] = {
                     "available": True,
                     "collections": len(collections),
                     "total_documents": total_docs,
diff --git a/ingest_pipeline/config/__pycache__/settings.cpython-312.pyc b/ingest_pipeline/config/__pycache__/settings.cpython-312.pyc
index f7519dbd84ad9754a73f75802a8db2f029a3e019..d4d2d4c2cf9c224449b9f1029133ad83b28504d9 100644
GIT binary patch
delta 3061
zcmZuzZERat8NTQG`rFR6V>@>2G<NJbwv#4J^SO0d+B99$Hfd5Q8*mW{ZthLu)OONy
z-R6TJXDkybOpxq=h!98}6NA!D0)h}f_<@k%2Z)h0jAoaLZa+4G_9y-LF+QYm-ebpg
zyIjf7J@50r=bZQJoa?uS-u_g@pX_!EN1qP^f1Z3kyjI~uzgUY!@)?6<$QUIf;$$QX
zX;a25nb}yMwq&f5HDi-(8M|a>oFQG25hXF>kQ|8PxdBc#E_1R;5pU>VX^xYe3NM=#
z=QuB0mW3Myl9MW#t(Dr^Ztw+CauqCH)YM*P>R!8b?0}$|`?A^TTr#J~nyEjXRMi)f
zSks?OWs_-Ai!k4)Bd?;yykby<YPz6el#M;~Et@2hVwOz{M#h<ooTZGj6gg`dXDxEJ
zGR{`y>}8z2$W;`%JZxM6B+n_LEZ#uH;2erbHI9<TS<*O}rn01Ql{A%1<1T4DC5?+|
zs)`!7Y?8e<eUQjJY$ti>)_W0GgOTi)suVMIAi$&=$;+ezOsbW9N;TC5nG}-zN<gWm
z?z`nWIeas+SD$gdnAdt{7nN$*tOh2<qyuagjo&TD<;2a#PfTlKh6knE((-Y+c^|tL
zW_L&mDj~VGxaDESwMli%?RF-aq;Of79R)5gMartv$;d9Lo=xj!(o<5j%z>x(ao`BE
zi%AV-cKZeNOmV$f$*xDvKfBL@z0B~a6sHj#D@N4ExZ~8>enlJ?<P*z+l#riea<N@0
zdy=w^)MAg}<pIhx(c&DGPu)Dd*AMcbe5P<>*nyUs=S_(rGAU%bHCtv{R??$m)7kOV
z#IWWZPhn*YCuh^6$(hvXMP**Irqh{{P%%BDWRt0l_k?;>x8MQm*=c-HJv5QdG<VE&
zHYZb9tH>z1q@2tp$;bLxlpwQ)9@I{LX}E;yNP}?^9p8A}_;2KBr;Ud@0lFwGOp!XV
zmE1AUSq}hL3lJfr79ScQbC&O*<D|m+1M<J18U2d<%XpZ4U_BUK<fhEj?ulpb7NJ_p
zt2U3(@D+ZMpR$vr&rMow>yrk}TnbY&LqxO6h07_-90Ff79gSHt6k<&naTVn-6bAbN
z0$?IeD7n$H)L<X5I?5(=co59a5xcz_oh31QgW*e*P@gB~?M)p!F7ItuY|9nfb|rSI
z{I{zTTUCjBc4Mby#k%X@9D#4;ujbchx5e0|DTYVr#4$wPb-Ph74LhKpL#hLjzgWF_
zI^yAyJ<lchg|-1D7wS8AIz&qr8lT3Yp`o)ORl!$MV~QG@P30y-BQ(&y)1mQXI(;EI
zcClqR!DBBt3Z7p_%xM+wqYyp|^a~UgeCL&1E|r~7Tb_tF7pH0!s<gztE4prr!7VX(
zOFVY%#O?a-t@`d;^+$i*v1vMnM>f{&FCo-LYQ(Rj4)SC1)BbK)J_2wCfF+fsH$YsD
zh=FBqfb=-xPMPXe1BDQK@L6)%F@)yG?;O9Wgw)UwPQel)j9bX6vn62%*#n@bpoycS
z$-<W*HJw#QM_Dm7otnesW2Yw%wZw2La1Fqt)(e6N%~f!;9!61s1`3)kmCfNs5CwoH
zfL4Gu02Uwppm6wUfFl6U0KlQfy#Pl6`rtmsCt)}Y@Oc18JGKH$QMk^r7ARB%qGX|h
zTAiZz`ODlpLh!xA{X0(Yj=yflTeDM9_0X(uGb|0Q#y11aTa_&jIKAFL8!MXF6g;cy
z`e)V_wuSgkZFp&L)#X{ut@*cw@J?NHX?V4Ny?*V?wh$$Mt0V^hVPG~CR}UJh)W@&2
z?{f6@llGsvuOE2;!`(Qq??cyI*K)7<A8;_fXW|T=_1Ita;ro0*?|z`;43T><D#XCt
zKSloTzWOX1VhCph0Qya{L5HcucEdSJeV6`J8-*qAp@Xxzzj1_yKpW~c4@O3)`*7iC
zkQQ%mE33wSg<v%(=9}&X>8D3DN51b3+VK})i(=E0KYE)(KLP^UXNkKLIrMt(ittLs
zeO_p?tO#$LYVZj0`rZi671kJ}FZ^YIMG7kXrJ-#~oAi#aAH7LJ)e!@PH>M-^g6@qk
zR(}n}>!_SCVOn<%&j6SJK1)Hfq|{Va%_XyA3cf^a0iU&OeR3$!LGKbdaMb*BYOKCN
zfo#^gH+~zK<NIEu(kE8cge1)<{wmesO8_qcECaku;qhZNUpt8Yu<`ra4^izrSX`w*
z4_C<p75;^>*xm{~hqMiModYG9<tt!Wyz*9HDkS7lE~udSNj~f+6X7=JKR|ba!auo>
z=)KYP6!~fRT%MIOfrb+zzDRXA4UhrI0xSSPvgnn3VM-ax71H-8CU6#mADSSisQQ~A
zuL3;YV)zPh06(NZ^}iIB=>a11k&jrR@D<veUF6OB&Sqx$_-w5b8gvFL<J5)X7ZZP*
zuJHj8qg7_8^l-w1v!o>&HDb85u#udLdi_vh%``JFC$qWKSm9D(SB{mu81?3%!7;nF
z*r|ZVFE|QoKM}!yOg;32eL1c4;_p!{G_DGn+0`M0-r<_x=Yn^+u5GUCeXijy*RjQQ
n+~s;78cy@by|Va_gZJ*|1dg}v@<vp(I(eTn5_dzF0M7p(XST8M

delta 2538
zcmZuzS!|S56ux)*&%Sq?cDhYFGi?Vb6e(M&w1t*}U<0T`|HRZ`{(oTVEam>gDmVnI
z!3CtbnxJCBgE5q1qG_TpZt=-PLqH_L9~F5Zk@!+552!KmoIAsGSSIN==brtXd(NF+
z-g17E>j$UPM&R?`=RfXzGBDw)p=T%Bf;mbQsz^yw$}F1&ZA@BHR@s`e$+nbTwhNvq
z=}0+cXUZkJC^3*BqL{~tVo{w_W$2O+*{vEBtLly$6x+Bom1h#!BXsSc>zFd+nX*@C
zdO_0(n$~-&<r8|J!=PLH)9Fk$npG9PoHD~t20lgS<rK4QQq79_fSC~0qF8#s3V7BM
zp0&WUmGEo@p1p);N1lPG4oHa>QgW&e@ail|Tt$gXNOJC?$Ws)#g~(f!lour)A*m=x
zyoy<=JXck$zZ^o}E2J8A6rWt7njwK2ajKOo)hamo#i>rNR((0O3NrR8^-9CJ#(R$9
zhFUNN#U`N`kZXilvpBWLwW_aR6;wj!!Vg)s3cWVjU!vFk2)zjC<%lv*u2buk`Gt@R
zgmH)5Ao5-)PG-5Wq_RZ?UQ<cyI|XmC91vEIiPI9fxg>$EM<lSc2jUZ@MQ$lkd{jlt
z3J!xsz2(Y^M>t$5^t$B`6tt>PP><j}4#}=o9dSwN9hc;=(kISlWwE#~VD|&N6|SO9
zS#xgfz57-Mm4T9(Z{Kf@tm9Xulw(-;#uH49vFP69^dV!2^6yQ%XpncCduRvWYu-ic
z`Azdd+A|%u{7vm0aGh)sLMI=!eG;lc67yq?0J?2kG`U+HWGurXWxAxP$vErhtL*R6
zUVhR3q0I<NxQ(+%_;ptu|Hbd)XC3ox3OywqG8{CFTKQ)!^?Z@@1eN%=PT!CS*9is@
zBddTfR*6uBPz|7$?NGCkGB${eCy-&+RJJD(Q%6$KF%2UH0s%I}`(3T3=i#LF@sw-6
z|CZJ0vmLe1IEbh2?cD3RlY1|@+b&qz*oNtE+^<j*Mm(^UXKbB(pZ6KMke~N%^)Cjd
zsFDpJC6W;7RP*lgph@J=&tv87-sdoq2>^n_2jZV9-$XO~X8D)p8-N`#ur=tyiFAa2
zQL!**2U2&WGK!iUiDlC9#12ufUZ!Q4?j9M5=3ksdCasN(JkSMZL1#XMx$E%b5niG~
z%1uZG0Q9m%I?F<Mln}xQ^I&)hTYw;{#A{+p5V{bSA}m8#fv^%`6+$1vdW6jg_)fAB
zfJwrzPBw&qRSLiwwJ<!fuac`$)Afq*6|e7#zxj%<{)*pKeaC97G#%bF<00Y51*z(U
zcJk?o1DB+BzO0H*U#eO`yFJGC(@SOue4SbHY2{@1ERwfE#8h>%?Pp`lZ9|>0a<+_^
zg13;$XCQ*F;kR0s@ngQH9v8=*m{2i4-2pQ+qN&+zBE3UnqaZwvi8=rdlRF;bsC=^<
z5`x)is9}_@;U{XJ?Gz2n_YS?ywN7+xu0z-`7|>B(<8N|DsF+j@pLCpx0e?r}6wn&Z
z(qZyzZTN%6qtaWh+Xg9MJ1Ska)UyqI!vAqoI`2h{*e;+ML#w&*-d4Ake#GCe3(^hK
zU)P<c8|%@)!giysih$F|h5>Y2LQABzY&0EH*$!kF<H<}kt6K;6#niDZOxUC;zfk!|
ze6pd74)Na`dg+<z#>RIH{d>XcA?Lajg+8)<7zf?5{RjsTUIMs(9cBX?=~vUe&41Cx
z3~J!`!BQ0K)9`m#EYAAiAiX$!Jm{ezp?L%~3k&};nqrbAo%k-a#d{f90|0-LyNAgi
z-U=QHZ_eSy4M*s3#LZp+l0^}=Bg7EK5U^FcDYJc4jb-!An=3`E2!_`sB?01bG<Xf+
z{&`|a<RQEVf7-tQ<1p`hHhkA4hAs)y_@YN>m00p*TTSQ<Q2q_Aa86<POvKTA$=-57
zY7z4~9I0S2ex@y))4gL%jYF0T_e5DDx;?3C;)-?4*nTCN&L(2{-M4@rv6f&^5X_A_
z{-?!oDf26elb=r>(|Dk&e=I%lIPFfVtJw)cx(JT2mI9b5qm*7H9XCkRH4?r-TCb6=
ei=^usS$)UUXP}iw58fg8J+qD<YafuX1OEdcqad>Y

diff --git a/ingest_pipeline/config/settings.py b/ingest_pipeline/config/settings.py
index 1ad4b1f..dd3fdeb 100644
--- a/ingest_pipeline/config/settings.py
+++ b/ingest_pipeline/config/settings.py
@@ -1,7 +1,7 @@
 """Application settings and configuration."""
 
 from functools import lru_cache
-from typing import Annotated, ClassVar, Literal
+from typing import Annotated, ClassVar, Final, Literal
 
 from prefect.variables import Variable
 from pydantic import Field, HttpUrl, model_validator
@@ -20,6 +20,8 @@ class Settings(BaseSettings):
 
     # API Keys
     firecrawl_api_key: str | None = None
+    llm_api_key: str | None = None
+    openai_api_key: str | None = None
     openwebui_api_key: str | None = None
     weaviate_api_key: str | None = None
     r2r_api_key: str | None = None
@@ -33,6 +35,7 @@ class Settings(BaseSettings):
 
     # Model Configuration
     embedding_model: str = "ollama/bge-m3:latest"
+    metadata_model: str = "fireworks/glm-4p5-air"
     embedding_dimension: int = 1024
 
     # Ingestion Settings
@@ -100,14 +103,20 @@ class Settings(BaseSettings):
         Returns:
             API key or None
         """
-        service_map = {
+        service_map: Final[dict[str, str | None]] = {
             "firecrawl": self.firecrawl_api_key,
             "openwebui": self.openwebui_api_key,
             "weaviate": self.weaviate_api_key,
             "r2r": self.r2r_api_key,
+            "llm": self.get_llm_api_key(),
+            "openai": self.openai_api_key,
         }
         return service_map.get(service)
 
+    def get_llm_api_key(self) -> str | None:
+        """Get API key for LLM services with OpenAI fallback."""
+        return self.llm_api_key or (self.openai_api_key or None)
+
     @model_validator(mode="after")
     def validate_backend_configuration(self) -> "Settings":
         """Validate that required configuration is present for the default backend."""
diff --git a/ingest_pipeline/core/__pycache__/models.cpython-312.pyc b/ingest_pipeline/core/__pycache__/models.cpython-312.pyc
index 719e24c0d6dcee75c29934b968bd204287b1d739..51f00b44b246327dc39c1d32b6b3ae17675eff9d 100644
GIT binary patch
literal 11783
zcmd5iTWlLwc0+OaCdG%S_rtU$Tc&JLk*&m5VkfcnaO4LSNODpW?b0L8l|-Ab%nWUl
z-Q6;E7PY$tDg$jJ1N~5oemICw7zMiM7K=70wrID-0@RW~sEZbHP%OGee^N*b6#Lb4
z?hIceWj9T0pakad%sKbox%bX_-}z^k%g({?M;Cs)_UFAE_iuPp{h2jnmuum;4>^&G
zaH2tMNf?qXk(Q((Vld#nF=0&d5uV|E!jv>e%t=eclC(ywjAlyMlJ<x_>4-Sky*c4b
zx*{%yTN15Fcf_6aL_A4v#GCX*d_cE~wnSUfAMpcjC+#aOqT>TT(gC;^a3|oMfOi4z
z0=!$pTLJIU+PeYo)#x6;`!w7Oc)y1G03T@KE^%Vp2b}09?S%iBS63W4#OUon?`Wb2
z7`+qdT}|}EjNT3O9^(GksEu-jQG0>fM_e`PAfxsJb)bPd#HfdW8fc&%Wz@q!J<>ou
z#;Aip9U|7+xWkNk6sX6@usFPRytbO-j1vUTNW<)cjCum7CmX0Ej5-R`Py_WuZY=mx
zerPH!k$@;DLLiwINkR_XjVo&bS&`x~C7|Ro@ziSQIW9ifLXFp#rl=Jf6D6J`K?CJy
zQrTqCNNpEVsk8!gky@t`f-JuyNYu8J%MfuI#(}Q<_3Lxf)RfJ}#R=$Wx|m4EZU=d4
zyC}%y8a|ntX5%CwQp;P4lDRG=sBMwNB%&-T(sPhi4thCPi4v8GqQInNY6fOjO2yPS
zqe5(muWEM$z=xb-P{|zkv4-5j7P{Xe_mLqSY>~V`r*4v5CZY&Wh_Vg&h}*^HznC6d
zODD<L9YKx}A(e`gv5b_yMPiCPCJC#fNg*Yy5@`(j5m||5;u(^Nr^r|gws%b3*-$1&
zyP_gl5wZy-s(Xyo4G(FBYu5vy!2OG(^SiHq>IiN-f<-<kbprAKVxf{B2C6RAnMfp~
zBqe6j@suKU0EazC>H>`R9x&5d+kR-_gG+9j?6Gafu_Ax$#Z0!XzF{H=UrLUrQ~Ejg
z9Wdv5;{Z$;7uh`N(QU_Qksp0AllE2L_OhVF)}nGePxNzctIfHg%^*y(XWvv$ZaYpE
z`I9eZs@>J8#?pxdh&60)G$WCf_&xoM>oVNXG$ka7bPT3Euy5L@w;iX8{OK1nZFf?*
z7mZ26-307oMp^sv$?6*hVWLOil5nG6_~bHR9ptYvIkn+Qm=o^i3!Iz_H)JKAAP0(N
zM@=l7n~lMw(6%-!(eSooxX2Ih-^Hr^-8~L{KI8}&F+j-CA{rt_u_eNb#)wJeBWBSQ
zv54k~RkTEGIcv~H-E+*2f)Fl(Tgl4#UiCkaUI_@PfNEud8@QET4pB=6EECYEBaT9w
zUX_R}Q(G*Z%p?dpB}+z-l(>+f<`n@}ECNqR#Rv$x7!KO0H5x_vjYg?GidH`hn-ZnY
zX!O0TkkB}mXjDwcfNXhtCOkbCzC;~!;pp27^OqK878j{)YW~{WS7(-HrlG-wg{8R*
zSE+gS!rWCL*rqOor)I7KsuKWd9A7bl5N;`I{Ri9*fAm>vXW>%Ccc^fs;^{5SRoJbo
zy)X;6@6WMaX1$s`LT#)2V3;r8>YOQPrmc%g8oU;{D8z2V*5!LI+<|=&mJ<X#KjQ?J
zRhAs0*1JTw69?x`?P=KP=v}g$jZ>p^N(u)p(ph+#G>PC<1g`<0)^}$vyfb%UX@=V8
zVYj01&Ro1cM~w@o7W5l1g?$j<2r@b+bpzbpg|{l+{=(&o-TnTQx?*hhwO8CAQ0c4`
zBl%v8PGpp)x-iL%1xq%<8mV0(nY0{-{m4-ly!$M89S}y4x-VO|5f)1A3o~!eFU~E^
zFWjK6>G`Sa*Ji>?7nbJc!}`TvfdxqjF2L2Wc)PnWr7qq-`2IC@@z|_s@wGtykAYKv
z-Pa*}j~H7x!V}Y0%g35fM9joOtfKK8v}HV71J6zzz~gH?X9LegT7hS(@!SnO5Al*#
z98ENfmM!bYT4c4-f}srbvSF{BJ?Nm$cfg^frKxmkCBB*usQ+1s?PXvkEd}l{emu`8
zp^psIUG+vQ0`|;N6N{m!uO0<dgAr=0yLg<!^Pd?x?xPmkvZ~OQ1PE>2uZDxZgXC3m
zK{pnFN$&tgjS&4(cQguN9tO4W!sTdG!k9;T7XgN8QUJlP0iZ^Vo(A#uHxS^9(ZA_M
zq#>AtOU6OI1A0F4xwoS@{6^XPW?|;R=@S3u&XM8b*~Rjar6S+4VJY!TJMBHi6PL>E
zZx!Yq$R+-*oipc(*KU^22!+e*wvEBZ*(Zi4V)@YNV$bPq&qSFQRAIp<9V{$A1CCx;
z&=3<7F^k5$h2z-Ev#8<#X4$%rW5(BthI${ziX37m7WLJGSXo57COS^hxaFvcBZ!sy
zG-%<hwjk~;SFMGIfXIriHJ-PD=Ob;z4}#|u-J)m9s}nqn=)+z)W3Y|7G&`qB-jV&1
zr!#k<e7n}ASxUpy6J5rXB?>7KVcsI&s`VX>F}ZGTAt$n{`ODSkfuYeoC;**OYM3R1
zM-v0pw1(+J)!Ni;6L=$$$T2CNL3yMW%{)_URSiICESl0#i;#&&Z<Cy~1RFu!`Y;W(
zM7n_>f&is9*nXg5pb$wQ6rA)81W^Pc0)k))0aFI1K)3MLjetciw-M8+#Z9C&CmPZ+
z(hw}bB|idyx^eQ^=yZ|yudi*$n@f-L+Z`h%e!4PxUQat;31$md*N<<U-t<3yb=!BW
z#AlzmdP{t7rM11px9<dwf`$Z67cM=xvEko#^_Te5JH3J8_*}X7a$$abvBY2giduzp
zJXouagPDD?S_RT>7i}MKTlSiUIEa&&HEnfhdSWN8h8C^FO+2ipQ*>>$?$Z-@t(Ui<
zm#?9h=YU?`YA?~Z)mEDgXe8*Xzs75C;I%Ve2l7BGJE?m%E<tJ!F}tcC`RS^j)ICD2
zNnHg3$07VsoraJIKtu;2n?fY;;i*I}7|M6n`!tOgmhi3RJuB6xY6{CFIX_u#3p!dK
z0Q`Rdv<>tqwaV0!O&4$K&t*!`BoL@rM!0sd{szT0D6FlvEOJ3(m|By9bX!c{O;LVL
zNhVY!Xx4;ZSkEPd<gzHdp6{y7M4erz%2|bhWe0!)_gD5$W{YR86ttwBsk#N6X;M(+
z=jivJV>rbeA(4I^P-??aUd@tF`>81rPsWucX$^0@xQo%G01<R7ol+pwnWesXDwfEK
zkRfE3#WeEdV8_=m6wEwG_!K@72j_~Zmvk2abCx#|!;D9|had-l^2_OTLdxTP^DaqA
zq#?Kom;5~dXfMLgMrZZ5VYV{*hMx9DB`E6bh4^{*!1maca`#m*5=-lY4{wzCt2+~u
z#mmd(i5Pg^+(z4DviaVVh4R2l#qO83-Qy)bwsY!C@vWQXQv&$z$@Rs@M>ofx_{%+^
zVtZ)YF;?P*oq@q8)8&EjBHzBQl=$(TLqkulqpt?v&X=`(m@TA9hERU+xBCph{|}=A
z<=IBV<7zNGuByV5)&>&-W~ae<+eP=5r)DU;#0NZPM8FvMsA~bD>}33&D(F~`#2~RT
zIMf={4FNdmDy^xtrs%C0x5J1{YCcnK32KgfHLkCZ33{!7F-fV;7}MeaB$6@6BT?zA
z&iPlW{3<B@pBg~rTf#weo*#jlAHrKQLWRMkm^Y7vazZkJ|F`678A~VT@4@TOcWCQW
zCttGycYr6OTP|=v2`m*FEr6%0veor8375`5HO|(U_l=B<rJxe4Wx(>-$VlD`v}iPw
ziwUtc$cd3;2U2J?t^j_J6_bA1#8I_t6ThKNoO;MT)y!1qEMYoawM&r8XCP3D!Xx9W
zDJZ7~+rF*|D!{PPZzA|@1X#;pkCJX8b|1kv5$ImUw~>Y*1(*Cs0MO!uzIud`(OI0#
z=SPNjx|a5gErVt>P~yhvM{zijF`56<%ncsj>AG<+tLIR0Y^K~jTe!9k>B4N2g(>sn
zYVeN}ZF=doO!2>f^I|QEXp3Mr>4c!eCE7*DmUCaw!7PT@8fmSybBneE+Icj~;u5`E
zzMAz=ElXRCXKdi1WigXBHUF%o7c3+JOVdtmP=8Pr>7W!8n00Fq%6sv?YBN|^qFEO^
z)IFLki#BE!<TL=CMp0VhEAd!;w3_(<5(+w6l-OD}b-Nl|tU{o%79c4&b6LY8gBo6=
zkA9BPcAN`<0A>NBcGizo?4JK45G2%S>QbrcJ48wdnOW7LcajtqbfRo<DDzhbr=2PV
z&Q{pEY6mJo|JTr~-@!@Ly*Tsq50Un}2$(i~7pKUJa1KPx>18}J(JR<@uq}e$f=m80
z0H|Oi&qm+WyYDwEqmz2tWF`15oq~Pq+2r|Jifnw!mk+&M?0I?H^Gb<7UwQRB=+ETF
z;-4ISGXB(GKJrSj|CQ~wGr-yz3O+qr9y(j(dpDL!{Mnte=RXn4XRomP&B4t(n<uvW
zLr?wN{V$jKE2_HTw42n;2n77?P6N=Z8<u6n78G9)Rg+qfVKi2Lfg+7bEw(U>W!gDQ
z&`P_ewer(7q6m0cw?N*@LO3htk5{n(1jCFKSixg7ndOl}pqfdBs9mjYMYDLchUa&(
zA|x}^8B?P@me^AJ-Lxb^0GLfFC~JbG;^Cn6K-s8gg*+@tHKRJ?`TNK~@OyB{0RZ@J
zPgOi^_vb6_&Jy2Q@nNE-5<G1m%&Yr~T@K#Y`~le(6rozMdQsog+P%87X2N&Fh_(I2
z_rUg-?Y@P*5u~X#48&OZig8&DgJCSsf;U$ki`6dJyJBXIK($1zSul*{R}5pujE%qo
zAJ&6aDTu8$PiE90%d4(~8Lo!=c6E+5KFg;X*4?S&cj@lCb@x5&zW%&k9luX^-;ejX
zmf!&O=%q1#b^$C`g9JiJuP%D(i87i-EXae+!7{Tdq@gf1DRBj=bdJXA2CoQkzH5y^
z&3P4ze->G-lu&CzNUdg}a81oZR#{6+)U4(u)CK{aT9={TH6pO{+qF2Pi&AV2%D378
zYW73jYk~}d4WSOJ>B!WMgm@CqXs8WwIJ><qQ!lxvNKk-;ic1vKYb`BON5feYb-_`$
zg5eU_dpK0^f<+aD<#-~l<f1a3{8C@_3?c=Qq(-x`Ll@YHHR`U1qO7Jw9m^6NOsr`)
z&>0f6C`@RL`q{aL00cOhu5E)Sp3I~r1rIZ{(OnX`6DN10pxtn8LS1ke4`CA#qY4p{
zLC3F9V-_6Ugcq%vZq#aOT1ljZeKs4zAPK=A!X^I)0MzS?Uzj<kd)@!=Ra9xOe_eUh
z1GN~SI@}NBhe6Q!R`3056_@A!RfYiv@GBLk8-Uw)KMaJfzKy9zxe_0!v~`sDj!JuX
ziSMp>{3YIBaf8{wCQ#w&f$@>l*1I7-dZWZ2L3;m&^5~l-ez4NjzsWy#miQr{dfL{P
z9_De7_O6YIN0AbLs6Mv_tOxr*p$YqR_Q9wL7!@Y5;eQ0{>DRC_->;e|T>UJ5%%DJ-
zIB~GC`U_~IcLER{fq`kLq&HOOiLF|TheB#Y<y|yyS!z)bmVR7l&O|dadREnJ;kZrh
zS|JLnwouKP8^)}bWO?Fgn1h!+nHjj8Iq0O;s*>mXAqj!t2I3M(jslnuf&SL~idtiA
ziNhhA=1HK|p}C^48i|<I@;)`GI$>5F5%`zdN%JqO%VRA?`W^xs0#<`$euqim_mRe=
z7I#|uYXnyiuo~nK5bHpIA5gFl8>GKP48afKl5YY)!5#kG?ccm!cAqF*e889Z6Pkn$
zl=y+2!^fT|<--$&*$30>?GLYP3~f7sKC#nt=m}r$8HEDC%j**l&z1PmiW4i3I~~2n
zlhfsn83;j)Wqw9|I6m@V85uahp?zf;acB}yKcjKp>VZe;ep}|6^t6KXz)35bb0#rX
z$nNVWMHpdgXE%&%Z{m6xw_0xGMQ6jfKH?Fb+H9(If#w!%#8GQeE$#DA9jMO@KiRU1
zs=Mp}Osx|*p-$kOtDXp7PA}*C8f8*{9?V3Ni41jUK@V2#rFB@bCXuRj-1j<+&|-H2
zK;x%F2YoW6pk-vg>b5R&?Aw};j1n`N##H*Qgv05@kEO@$jf<(J^`AoXT{nON_k*s#
z?fZV;4`Zdt%LP?<L0vFl2SW~@lCURh03Y(dpSSdPFwFm8t`%&K8pMQ~+Orw_EDR?X
z#*k7wc!yi+B9fGrz<<gz_*XSyX|0+ME!1>trz27ASR>eZpr2yd#X<IfX*@fLV3uJV
z=Y{eueS+Zc5#U>q{s95Yn|_4YKOwk@U<!fGQ2Y(j5ES8({{R3Qieq|1;SHdt@^o$t
zK5~JRz@&Ws)00!%C#T8-(_k~^;ot&J9Ja?VmwT^(MX;9mEBo#t@fa!(ondLr(jzDz
zo~a#NK(4R)pVMe?4CS7YLU?_u#E(?k2h04RYFu!d`=kPB-0lhhy#r#As6Gq9+(Vy*
zU_8sBWH1FbVsCOmcH-0`Y8Er+Z15pP{gi!y$nce0{;>ML@3W0sB|k*X@CipWF0xle
z+p2;g<98fbeuKEmQzvSlZ+JwlKnTezcpXtzy-;hDsLA1=>p(H8`w=E6H(`e)<~^8v
zF=z4<q%m323B`|*f#5T^<d*@UP@H(?#DIob|4MgXiSMg)u%M-b`GdgGr*H=K8oamZ
zjkZT~W&Snwt>HM~;7Rt;gest@$do7WRi$J?)C`6T9Il#SW5rLhvKIIqrRon+9cUYV
zsRc1|NR4Mh7<)<%<XAH~QAjEAnB>IXY=ulw(9TdZY#vlw*_V&%a`Ba_N8L9O3m_Oo
z!2D?tF;=M`LyT=7Qyr#&?38;M8A$}+Mu6!tOaEA`s5)O1R<?&aje`Ra_2Zk@r5$L3
zXBhH0z%PsjgJFjo`FHNfzjE!LapT+E_-9<-Pr0L?ag!x(@~7P4FU$tR$mZZK2Y+8!
z4Tj;(cM%^(JhT}@JcRh@#v<aQh)<~PClGJ!+lU|EG-CVXdseHVZ#}j#vBv?j*I_bv
z))zO1_BcTHJSM}C$^&H2V>T=s)+hHk{NM9A@NQ<0!~eZLhhbu!;LXHdU#sC1GT?9T
zh~042ux{Gp@PDtzZ18X7Z~*_F@1$X%*g5tz`*RMky>A$7hFQY{VB-H?mlK{0kAlCw
R0juHMdi>`wzjI8w{u@2jPTv3k

delta 4134
zcmb7HZERE58NS!w_Vst{IQ~ci2~lt$kN`;=NEs<hfdEG1YpT`OaePjk3)dgJb_PkO
z*_D`JKPH8qA7e~w*{W(V(ry(3F=<^lY5TM7N49uUVre3kHf{V`r)GcpYwvq*oH%Z%
zI!k_h?)$#yJ?Fm9b3T0imA{TT|LAbo1o%9D_@}8y%{QGbx;gRY&V40OAR;j;mW(xS
z&Di2L{%lgDj6H7WZL{LYIOEQYEAGm;<L-<n?hyr@a7-YUYXY%SFE!jZU}iyxH*vcS
z?9wK?kK65FcWkozbtO#X1c!?{@9WpnH1lvbSUuFfZVhm&7pzTn))sE{fz@AU4RUKU
zSOay|5Vy8~HAu}`UIMcYb8`sHVHzfp`PTLKiEvLFc-rfx*UGKiz`DK8+QzLNVC}54
zw$JQ{cCp>MQM;~c9m!^M#bl8Zc3pS!LCF#kSxkRgQr+<09PI3&b+@U5KeBIGf^XWg
z?f^cuAOsOY?Ax~X;qBPuah=%essRQUd;r&kWkc7BD_B0h<Y_IBE!kXe9Mw8>X^A_T
zU;5hTlYdj%(U`m!lOwcmPHuCRk7~(%oo}4hlJ~wD3W~ScCsLq9bo2WAB6NXI+(=E-
zObo-&)(O-AUkfqTymfI_YJoUYEsmJ$d^Re9&w@T;joYb%N|=k-h%|4%ufuT!VN!=x
zf;g)K181C37rSZiOV0XoijvGE_fDi~Z)X2N1!yP~?}=42p_9pJrC2p)a)c_g&Z%NC
ze{k<!Mak?@k`q-g%}h{2<ZL=Yvm~FBvqf0|y;rS7&d_W@&Sjs1hy?bTy(8jO8`%Pn
zYDajUz2FFy9M~K}I0#VHLpJpYKAI33SRFtcLN|O17XZEktoD5DX<ld_sCWj;qc`?1
z8U~j;x<4>4Jb!$#??k0zY{Afc%e-h9TlR<U9H{trmQUO$EE;w$J$JA?HW#tp>iog<
zUGXldwC`UC?f<j;K*exSqiz7HyTw|aK%G8rB!)OphBRRvDG;+xiw$V8)X0lV)K1K^
zW{9y6>l$%3VylaAP$&2#PMkgNqHgK|;%vl0ob#>*;w;2H47r3EbJW9Zt})lFvrx>b
zNnkCN%TCJdhAYPY?(&vm>L7$w&B?r+xJ+k&j$CRQ2q_k-t`u-hQ$?UAkxgc(dI%y_
z6o`s*P+vee0uc3X#aGpxm{4-5%ZcJlp7I2nEd^ydT`k!Ygcee&oX26b1^6Q7<qUJi
zkK>~gVGLme;Rpif`Y5&<2p>foLLYn!;{Ztb?v=ov1%q!X(2dxXD4$w!gqgv!ZO`3s
zB|K0*Gk0#$FrX3q1^kX8zkk@oFR)-H#%sd7X`M|AFm2;YNFrv=n1wGjCy%uPuTleJ
z60!3*2QUjvuf;jHh;v~a_=n8IJ?~i`668Q7;$3r^NmHHA%Y8od&G@6u?2b3@opn#j
zDov@$D~hIxH0y0T#Kr>=_T8q4o7c3iu<T(|cMywOkO0cUW7}_DT6pecS=&F^Z|%Mj
z^JGrVB#VWoMu>PSBH$i+Pgm8YsrnUYR;`)jRbV_{oYK^UGpZUDIU^U(tAlKxZ&xW6
zZQ4ps>PZMyPa&K};M%x|-3^LdC~CUk(s>2l8{&8sA7A5v6S<tCCh)oL#qjY=4Gs&f
z@P=i0M9IWf0)1REQ7)NS`4sE-`}9i(23X7=0I}>FU^#z49AMY|+qLuN49m3!#kc-%
zeQ>_vCQzp#d!2@AJA#=j2TKc|IPM5*y5apDpq82sROAMylXLEhy4icpr`)qnmF9C9
z`D%@EU*H%pe%8<H(NL6gtlSdzo`-=7xRsQJzic~S2D;g5;L5W*l)hfy;brUqhN_!h
zO)1laCi2N*k*cuaA9>LwXq%4%MKLKWG*OUe>G`ThrG-3fJc+bil+)RqN@G#am(@f`
zr7)g4jxd72HIc^F6awEcWNal78s0gDHUtz};W7Z~V9(~QBVIoBaYy%Z%lTEkuG0k4
zm?O9L-;_TUbVk#E*oVRP&O0-eV1N1a9Golt%Wa)^zglVQUoiORiWNh@c1)yj8+n8>
z@zstAVvNH<L9IZgjeW!JFG<=#Ky0vetl5b~jBq6AU}ErDJEb=y0EfZ6b6o<OJZjs8
z4R(tSA3r{*SIa=${NRy@hpWXM^;WHC_pxwz*gk7h_o+3tWWyKS7{S-BENp{ToGpcW
z+V~j~pxNXEkeF7J`6)Q%RXH_<CrOO8M?$49wWt+LzOi)q8t43F(UC*otmUCqH4r(a
zt^2AeH*pCB)5s?Bry{({m-Q^P_|d--=;6z{lP~KuENeq6)z<H2Sik=o+3NZ+g30(~
z;M%gLqXzX9(SdM@-D-<!35&QPJXmQvtUvq3S;yD2@>j$`s>Vqrm;Bsoy^fIx1(xqv
z)rNVUUF!TO0#`WmI{j{b+u*0lj4A41qdSg?gY0`dLM8PCCbw;z@6T9Xy#7`k?S}{!
z1YQAN3qFmv&^C_neT26W@RF<k7@?s)x6yW6fIL5eRw2RmbX{z^bF$Lh2bU^+#n7j%
zjoZ9rA9P(5TX5W}RLD)MDatPr>NMsUWbNHAcij_X_w*_+ls=ogqUzDrFyuM*c6TWB
z5Imo{0LsFzT0V;WGV;6B;?P(bH?zg=*FrzVj(4BcTY7|^pCNRx{LYJ|t$2K9sdzE?
zZH5=kjcLLN?;_ks;CgxwTkj+M9N`xTe6Q-lR{dK+GW8uaBD~MeMt`J9;2kU*bN1X5
z-(`<`F2uK*<_3j)B76W&9H0L<W_^sn=UP7~*dCw*;X{_*b=cWadyGZ5!QZI|yLuc|
z!}PRFG@V%4zjp;o_+Pnd$<L4^-1k$egnjr>ydwNow^0`Uro9+~w{?Dl(@y3TKJvxP
zR~Q!_*Ag!SpV#KOer6elzai7gUV2#lHFOr?TlhV|Cwfs7mxZ2x3LSqF{7;1LCqm>O
zLe~>vXi*qiHL;7myM2e|hE@fWcxcrtiHGJ!R|WWCw|ige>c26wDp<w-)fT(B1B2ja
Qwap?9&&mH4;D@XCe@PH<y8r+H

diff --git a/ingest_pipeline/core/models.py b/ingest_pipeline/core/models.py
index 18adfc5..d2af2b2 100644
--- a/ingest_pipeline/core/models.py
+++ b/ingest_pipeline/core/models.py
@@ -8,6 +8,40 @@ from uuid import UUID, uuid4
 from prefect.blocks.core import Block
 from pydantic import BaseModel, Field, HttpUrl, SecretStr
 
+from ..config import get_settings
+
+
+def _default_embedding_model() -> str:
+    return get_settings().embedding_model
+
+
+def _default_embedding_endpoint() -> HttpUrl:
+    return get_settings().llm_endpoint
+
+
+def _default_embedding_dimension() -> int:
+    return get_settings().embedding_dimension
+
+
+def _default_batch_size() -> int:
+    return get_settings().default_batch_size
+
+
+def _default_collection_name() -> str:
+    return get_settings().default_collection_prefix
+
+
+def _default_max_crawl_depth() -> int:
+    return get_settings().max_crawl_depth
+
+
+def _default_max_crawl_pages() -> int:
+    return get_settings().max_crawl_pages
+
+
+def _default_max_file_size() -> int:
+    return get_settings().max_file_size
+
 
 class IngestionStatus(str, Enum):
     """Status of an ingestion job."""
@@ -39,36 +73,36 @@ class IngestionSource(str, Enum):
 class VectorConfig(BaseModel):
     """Configuration for vectorization."""
 
-    model: str = Field(default="ollama/bge-m3:latest")
-    embedding_endpoint: HttpUrl = Field(default=HttpUrl("http://llm.lab"))
-    dimension: int = Field(default=1024)
-    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
+    model: str = Field(default_factory=_default_embedding_model)
+    embedding_endpoint: HttpUrl = Field(default_factory=_default_embedding_endpoint)
+    dimension: int = Field(default_factory=_default_embedding_dimension)
+    batch_size: Annotated[int, Field(gt=0, le=1000)] = Field(default_factory=_default_batch_size)
 
 
 class StorageConfig(Block):
     """Configuration for storage backend."""
 
-    _block_type_name: ClassVar[str] = "Storage Configuration"
-    _block_type_slug: ClassVar[str] = "storage-config"
-    _description: ClassVar[str] = "Configures storage backend connections and settings for document ingestion"
+    _block_type_name: ClassVar[str | None] = "Storage Configuration"
+    _block_type_slug: ClassVar[str | None] = "storage-config"
+    _description: ClassVar[str | None] = "Configures storage backend connections and settings for document ingestion"
 
     backend: StorageBackend
     endpoint: HttpUrl
     api_key: SecretStr | None = Field(default=None)
-    collection_name: str = Field(default="documents")
-    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
+    collection_name: str = Field(default_factory=_default_collection_name)
+    batch_size: Annotated[int, Field(gt=0, le=1000)] = Field(default_factory=_default_batch_size)
 
 
 class FirecrawlConfig(Block):
     """Configuration for Firecrawl ingestion (operational parameters only)."""
 
-    _block_type_name: ClassVar[str] = "Firecrawl Configuration"
-    _block_type_slug: ClassVar[str] = "firecrawl-config"
-    _description: ClassVar[str] = "Configures Firecrawl web scraping and crawling parameters"
+    _block_type_name: ClassVar[str | None] = "Firecrawl Configuration"
+    _block_type_slug: ClassVar[str | None] = "firecrawl-config"
+    _description: ClassVar[str | None] = "Configures Firecrawl web scraping and crawling parameters"
 
     formats: list[str] = Field(default_factory=lambda: ["markdown", "html"])
-    max_depth: Annotated[int, Field(ge=1, le=20)] = 5
-    limit: Annotated[int, Field(ge=1, le=1000)] = 100
+    max_depth: Annotated[int, Field(ge=1, le=20)] = Field(default_factory=_default_max_crawl_depth)
+    limit: Annotated[int, Field(ge=1, le=1000)] = Field(default_factory=_default_max_crawl_pages)
     only_main_content: bool = Field(default=True)
     include_subdomains: bool = Field(default=False)
 
@@ -76,9 +110,9 @@ class FirecrawlConfig(Block):
 class RepomixConfig(Block):
     """Configuration for Repomix ingestion."""
 
-    _block_type_name: ClassVar[str] = "Repomix Configuration"
-    _block_type_slug: ClassVar[str] = "repomix-config"
-    _description: ClassVar[str] = "Configures repository ingestion patterns and file processing settings"
+    _block_type_name: ClassVar[str | None] = "Repomix Configuration"
+    _block_type_slug: ClassVar[str | None] = "repomix-config"
+    _description: ClassVar[str | None] = "Configures repository ingestion patterns and file processing settings"
 
     include_patterns: list[str] = Field(
         default_factory=lambda: ["*.py", "*.js", "*.ts", "*.md", "*.yaml", "*.json"]
@@ -86,16 +120,16 @@ class RepomixConfig(Block):
     exclude_patterns: list[str] = Field(
         default_factory=lambda: ["**/node_modules/**", "**/__pycache__/**", "**/.git/**"]
     )
-    max_file_size: int = Field(default=1_000_000)  # 1MB
+    max_file_size: int = Field(default_factory=_default_max_file_size)  # 1MB
     respect_gitignore: bool = Field(default=True)
 
 
 class R2RConfig(Block):
     """Configuration for R2R ingestion."""
 
-    _block_type_name: ClassVar[str] = "R2R Configuration"
-    _block_type_slug: ClassVar[str] = "r2r-config"
-    _description: ClassVar[str] = "Configures R2R-specific ingestion settings including chunking and graph enrichment"
+    _block_type_name: ClassVar[str | None] = "R2R Configuration"
+    _block_type_slug: ClassVar[str | None] = "r2r-config"
+    _description: ClassVar[str | None] = "Configures R2R-specific ingestion settings including chunking and graph enrichment"
 
     chunk_size: Annotated[int, Field(ge=100, le=8192)] = 1000
     chunk_overlap: Annotated[int, Field(ge=0, le=1000)] = 200
@@ -168,7 +202,7 @@ class Document(BaseModel):
     vector: list[float] | None = Field(default=None)
     score: float | None = Field(default=None)
     source: IngestionSource
-    collection: str = Field(default="documents")
+    collection: str = Field(default_factory=_default_collection_name)
 
 
 class IngestionJob(BaseModel):
diff --git a/ingest_pipeline/flows/__pycache__/ingestion.cpython-312.pyc b/ingest_pipeline/flows/__pycache__/ingestion.cpython-312.pyc
index 5303be42c35a94e1038887315805ab66509414c1..029aa8dab9f4d34e36d9f2ce31c07112126cee1d 100644
GIT binary patch
delta 46
zcmX^8it*?xM&8rByj%=GaFzdThSEmfRe78o1(hj@c_o?2n~&u^W@MDxysBU!3jm5@
B5j_9^

delta 52
zcmX^5it+R-M&8rByj%=GAo}A>hQ>zTReAh;1(hj@c_o?2dL@+wsl}TQ<UM9&RN1_w
HU?B?t{Js;^

diff --git a/ingest_pipeline/flows/__pycache__/scheduler.cpython-312.pyc b/ingest_pipeline/flows/__pycache__/scheduler.cpython-312.pyc
index 8e5b11ba52b3496b60aeef35c6278962b596ba8d..0550c9b3e5983b7afaef6e9e042cd96911df441e 100644
GIT binary patch
delta 1374
zcmZ8gO>7%Q6rPROYkSx0f3FkUiS5QM*+48Pkw}PgD2=I-N)-ZB%1Xs@JY(XpYe%zo
z(-crR<N!iKjph=BkixmgTo8wH=>dUI6E#4wgak(<Bvwie9GN%yg^~RBd+&RG^Zw?q
z;-@A32VGYYKbLO(xHP+|-@2_y2uoP8!;Wt0PQ;1`Jzz(jm=)tVh(mVVNmvOdX(hR?
zV$DuDX)Em*mf>WqjD!ZzHH5<(2<ycEzz5M0vIa?V`7--MNpAiWThHP+$>Ib_<0LU~
zipV%U#GSCgt<ie{jxr>7j0Q=bWCeS~44wL9Pf?Bpn+DEr_^n|)%>9GHpGRoQcw|Gi
zM%JQc;ogNe8cPKCY{IZ~ZP=9hvDbU;HlcH5#qO**q}}B<zf0&Hvh$tPlaw^ii5l#x
z@7Ds)3DG<V2u+7U<Upi^U^DWIhA@KO54PG}9;R;JplP-tSEVxhUcQ~naIPWR%>kSs
z|3QNeZtT3`|5=)ah~jkNsv|UVf*uSUp%0@UM3+k^*0V3031pcQ$Z6lMqPxDg(W+!d
zcUa)d0m)=9sG}Dza#wl@#4}v<BRstpu6IeT*`jWjP5@J3YidbKvoF+a`Z@5@FmW5S
zwbE^M+Gd<;?6I0%zW|KCX?N<~eyDo4K?F@h5CO`gP!rWbM7Zet`Bgna6)=c?B>+K*
zW{ip^|2H=}2K+dPXF)(F$N6#8uZ2(ATf0-IbP8;m+v(8;sgZWi>4z8VjrT|!3yn?#
zpW@lB)>d2Hr5ZjRw;SVB@qdTr*h8(PRyhUZa2MF0+CFdL!*Ds1FYXsF?@!J@$t~>4
zgHN@>FWSVOHo^W58wpQC;mQG0!it9!zw*!FRaVePbOSvyw7IhH(Wo?6W()c^@9-tl
zS14(cMz<!G&6Mb?aFYbth^^|!1#v!AdY!XvaEo*C5ju<@f8zeku54~EK9Nnak!FFG
z*v-f|`z(@QhmAeGr~>7?6!wiS01-dVpyD3C3HNM#XC!ZLtG;Lxmum1Qt<j;R;&d>v
z-E-p&wc76z7dC`KLn$Okr^SqqUc+0}D>vt_yji8NICK_5$##qH95h)JcK%hd`DjIc
z={NK|dq4W}`fHM;JXLki2jKTu((?oG6qG1>0Re-^81q5`swkD)%}wkjE1o6{VPp(#
zO>SDAF4PFhWVhxvm%XS^V@QjB?0#b2$9rnliwj!<4du7+=c<<!>QoAq%G>xW)k_QA
gK#FmY5wJNBkjA$scgLpoMyEZ*m9Oz3e8epN1@-$#U;qFB

delta 1300
zcmZ8gOKclO7@o1$uYGveuXX*1<42)!M4d{lls+V+LPDTWkW$2BrKoZ|6JoP#N3(Wc
zxJnK=6me-ZLJFWr;fT^(4j>MkazN07qw=aHB)B87QhneCGm|t#9ce#*|M&m%d-nTh
zKPmlH)PB@78L*Z9`r)#<p}n^tLx3O(+KQuEs-sz&h(mVN(Jh_vFpAiQ6SHDY+={bU
zMv9$ql2+15St-Y~ObC2n4j^?MAPon0{Jc8=RvO1!XXu~7#KzCYY6it{2E}m_C2$HQ
zv4m0?R)kEZ>UTnnrE&I<oxnMq5!r)G=BOrn#Bx|(GEsg#VCB&mtCvN64(Ur0Dy&P^
z*loQ!ey4n`v5ZmA#uUN1v9I7T;9_zESK-i@@3q^Q%-|KfbKAk~?(X-n2ZJU%6G_vT
z{g1~ZoQ`qGawu@fb4UrGm!z|%5P3WdH``s-x^BNoOu8=3!sqA@(n9V8%Qb}EjPMm^
z4>#z^8@n$Bet~cC-eR?Q?`PIs-3R)5AM}-ev>!rRAASM0d=H{KfrG-kMtA(_7Nqx$
z9UpCmO3HUP!7cy$;3ljZyPt-(d~lMUl`G2gtdyMMFhT2bGFanuihd-Qph>snZ1yx0
zh6=)NgEUvV%}$$e52^-H=|efYP~qvolHI9yhmqM^4SZ0;-;O98_<NBk2c5w%z})Cz
zlHh{yG00doMuf-54#V?RdR0l+$rRtGKDF}tjXEJ0xTLt99%<m~xZQJx>SDd|A#NiP
zk&ApgZ$FgL(J<W@6N=9+lBau0Nq&Xpa_n(mrGG0w!8qMhPim>jUz5}O$?3JLk7EV;
zuWDvTN-!Q=yD~C>Y7C6>_LWD<)Igg0XLOC8(h6D%?4^{Mihr*RXDW1F`!-3~Ee2Ic
z=6G+&pveC4g=ns_!UcY!H86^TfPC-LKq_r6K9Wk}R#gk6Ok2@OIkZCX5^i)!nBI>T
zSGoDa*r8T)4{x$djtu`l$&6~&7j5hkm2XlS9fE642VvViHjqfO{Q-8xVEJiCoP!w8
z!4-aY_VPQgU4DC(@JW;6i@cR&H{CAbmXX&v9QzjNvR;!izk_M|xqfkV9>O!f$(rZq
z<PRg^1vv47AYSxBf`)-P;Y9?MK{7YUo!(E>JVgj9Ff*IyHY`sQVHBjZn=>0NPZyy9
z6#bt2arHjhm$P0>XmOCqZ=%m+FCoJ7Nl-eujlPt<l!#3bG@qmeZTUj5ynSvkaelvY
O!2>M#295ZSaQ{DCA2Y}R

diff --git a/ingest_pipeline/flows/scheduler.py b/ingest_pipeline/flows/scheduler.py
index a806558..748705f 100644
--- a/ingest_pipeline/flows/scheduler.py
+++ b/ingest_pipeline/flows/scheduler.py
@@ -3,8 +3,8 @@
 from datetime import timedelta
 from typing import Literal, Protocol, cast
 
-from prefect import serve
 from prefect.deployments.runner import RunnerDeployment
+from prefect.flows import serve as prefect_serve
 from prefect.schedules import Cron, Interval
 from prefect.variables import Variable
 
@@ -82,7 +82,7 @@ def create_scheduled_deployment(
         tags = [source_enum.value, backend_enum.value]
 
     # Create deployment parameters with block support
-    parameters = {
+    parameters: dict[str, str | bool] = {
         "source_url": source_url,
         "source_type": source_enum.value,
         "storage_backend": backend_enum.value,
@@ -97,8 +97,8 @@ def create_scheduled_deployment(
 
     # Create deployment
     # The flow decorator adds the to_deployment method at runtime
-    to_deployment = create_ingestion_flow.to_deployment
-    deployment = to_deployment(
+    flow_with_deployment = cast(FlowWithDeployment, create_ingestion_flow)
+    return flow_with_deployment.to_deployment(
         name=name,
         schedule=schedule,
         parameters=parameters,
@@ -106,8 +106,6 @@ def create_scheduled_deployment(
         description=f"Scheduled ingestion from {source_url}",
     )
 
-    return cast("RunnerDeployment", deployment)
-
 
 def serve_deployments(deployments: list[RunnerDeployment]) -> None:
     """
@@ -116,4 +114,4 @@ def serve_deployments(deployments: list[RunnerDeployment]) -> None:
     Args:
         deployments: List of deployment configurations
     """
-    serve(*deployments, limit=10)
+    prefect_serve(*deployments, limit=10)
diff --git a/ingest_pipeline/ingestors/__pycache__/firecrawl.cpython-312.pyc b/ingest_pipeline/ingestors/__pycache__/firecrawl.cpython-312.pyc
index 9ff5513ffd6199942a93d2474856e792102bbd0a..20330d4e9976bed61470f80d644345d46ab658e8 100644
GIT binary patch
delta 9043
zcmbU`3wV>)b^n!qNtR{#ZTz-{-!itbvB8D_0oxeN!`PUY1wj`2f7=2*-200f2t<UC
z7MgAqyG`OGYr~pufk79i=3AULT?r%|?Xp&`y<+~Q4PD8;KC+eu_gk8MU%PYeZ^_`8
zt(!jk=-hM9eVoTV=iIB`yiMNz2}%4Xt2JJLPru`z2m1D&P0Z3Q(VeYugnWsPL|>94
zi3k#rOx|Q)iX(;Nao$v4nj_7Z?nw7#I5IfR>|Nl?bYyZo-kasic4Px?krKQ)zFbEx
z$F1HxU%n%s<B8q^U!kMWXLHzm3mpr6MUEn0v7;FJlB8sBiLcZVDkXw!rAC+}#arep
zca#%BC#)Bw)Kh|#CMRCh<E90{QNgL{K+U*^YUk7iK+U{|TFI$dK+V2~x`<PAfSNl?
z4LPbfIS<JBvt&m#rxpOUP|lBSqJ~p#KwT);#HfoowFs!i_fTs&wFIc8_fYH1f>bM&
z$)<imHp)w~ogiDEE*qd!F4s#H@{&HIWIttaH0T7`ELC1wbdjL^f~J)!n6CPwPNQ7Z
zz68fozElnLEtX4T+gf%+XRl*FB#+zls&#u$=Q?N0hIK8Q+B?>(ah)^}47dYcRdl<Q
zAam<}9Y3RJ;cg9k)shjCbVp5sAR8q8N?1k~V{LIx+c2kXoYOYVX~$`8kX}Twah2HI
z<`{2CTRc8S(At(c?SwgP>zsDtoOaTjcJiEdO0@mRjP$9TV2bT94cnmDbTy^TLuEI0
z4SBc7L6_tTx{g*v)oSYtP+P3u=9^)#1@<41-9e>>Jz;$~&#VLvQMbHf+h#THpnPN~
zKqW;r(!l;eP+>~rwhYzO=lZnA9q_C1O3)QNq_hMinPnT679}~IF26qjL{Gr4IGw8K
z^(aAA@9_sO2zSvf*hz6~r~nX(pb-9*F#t~rH^n8lEQ#UtGb<*<jH#6LaPVx-gqS;(
zkQ6RCvvERPFqN1RZas5gLd=@VEjX9{9PpJ+C8dV9pE)`qX7k?Rw6pDJ0_Vi>#F7cI
z<es6{<Z#0o$Ap+Um9}6wJ#-ev=1<M8HrqYB?ktv`Ib3oUc2F=i%a@!Mmd?gciaB(7
zR2DZNu}{otmjLNmK^7cD5*)f65X>C<&^=zOd9g8ONAAU7M}wLav(q+NIphr<t$u(N
z6)^UoY@?hjX37pVE^1!DT=bw681maqv{n#80<D8>QQRA?N5BoT6tM;bO$fMPD-c81
z;s8068~|vp##@Pn=Ss#C%O=FK8QV;XS=ulhF~2_YpeHm}A+iYPS;swCZx_|%nB-er
zgPT46gAaCK*PzV{3^A!y{UPe@up3d#Pe{pS0~tX6ITEfxZUndo1@n>SkmiI_8#IZq
zbAE{`pl3dTc<j`Il~D^;U{+C0ZS#bp=hHPfW7^6GnAQjKeZsB=lvvSB`3V`9!EU%D
zl$&#ooGsYf5(3x^|H=XYC}_hiOHw4+Hf~vXu65i}F)3DPLL>WqLeB(v;cgc6%nFT8
zEs2u;l;{w-?`Eu3j`-a%Gj_|00s-M@l_q8=;N^knekPluam8%e;hxDbuok8nL3jfG
z?<N4)BoJ8si10Q25V=4)xH&HnRa9hepMs-o6g^ipxV-^IKAL;~N}-wk)bQR-IH?i9
z&xMa37k+<N1oWg%Bo}lL^yJ_n>hG`{=Jh8WIoFfgkcMCb{3~$)PJx1#-4@F<m0}lh
zpH0aK^#V4lLM<}P4GdC(WB{caC8KPTOmduT;$9`nX2`~I&=W6Nd7oLfXdwj55D$G8
z$kYj7ibOU2e%V{R9@!r}x~MZWlWFI(gqt(X8bXb8&KQSog<bz?cA=;NO+D>^-D4Jt
ziVGdhnQv#BO}cUDW&~RhtOWo`CqR9!pyJj;EBbk$SIn+%*VB!_&L^SU0aI`STgW!!
zBStNL&UF$^Q8ilU4xAvi9~DlZ&l99AK>dI31`i?K1wh+QbT@i9@<+4g)eQ6?|Li_!
z2R2d7cI&(j%AJwN0q&|i{_y|-VGe@eP8{Bdpa;R6SkZ+v1h|T_1^|YNrMD7`&q?En
zl@ns+&&0A@V&^%1MC?2-jnrT805Z09LhSshxO=!eBJMt)c0PC^2aw3a-IL;O?F8VI
zZb3MkmbMw~^4b6W5SS!Uh7cM(91`S;KI3Vjk4VN-R)^`daF{sa*cbJ!ITo!Rak`-(
zQB6JwD6W2)`z-sNesiCuE4^w^4h_l_yxQsUdxB0U-3uGBi<+N20yrnAW~bBbbtzEC
zC>RuMHrojvR%kD@j%LQf+d4`Ev?e;4ll?}tg)~{YZOrr9hU=Z%hMNVaRIM`$x@E7|
z>9iB-0xCZ^YqW*;K${|PU<an|kI*Q~ZpEsV--<dz`8hosHsl+52H(RHO||S-hV`xU
zrNlWlmvDXr_#ca2OKypAnmiJp>?Px}r808P8QqUG1P9>%ZZ!6l#76hSXwSy^M&ba9
zU=Wc31bp*IQq2J{7OyB(i_dk~2|<~9WQA@Webe+cl7#gLE()JJ57Sh3-2ArjAT+3#
zZHQl3!1F*Vjyd8S@&pH*`(5sXfxbR^1b9BpJ{#|{KsmYa+^)Z>9M7#Dy&Hd0w|XYv
zK!qEGVA(;jOr<si3lS6{C<XxaFE5pyP;}5zq?Q3-?^%07v<92puQKPgf3z5xJ12b%
z2lC1IQN<Z44;Cj7dmO<@1WzD1h2Tj9vGw?g&Y5eQW5|QxsnLH+6p7{=$Jhr+*`#^Y
zm^?tTt#Ts2TcmTCEL*dI8*vs$$;d8{bKrVvg}bO#5|Ik&2ynTOeJLfE*x2hS#VrdZ
zo16;i$P9fJNJ0xCK@~}MsR+J{rAnz7zDuMMxl}I0xo75q)(loAm$SmulkA%<X7X!x
zG4+GYhF}UX@=q`|hGnql(^iI}x6NaM(-Q4EVw!(IwEvj?k}-O3oqv3>5X9Pse@ejA
zM0miA=o9#P(3GqpeU$jw&(l{gdJ5P&AVg=vH$9CY4S<@`7rm%CU4tGcT(xKe>&mFw
zhT`zZOOp{hg8&Z(lpz}t$0^h}MGgi%{(gnx^lF0amj(lH&vGh3su+L-;c6zS&|da-
zMxpU<fvAkLUuHDub`n;&V0EZ?vbgb$f~maXOWh+`H|jQz*KMAt-ZHJ%tw_Bq=nB)q
z;?tJtc%e|^i*)XqT)umvpa;nxy_=Nvp`bJGB)4-4CJXB?@4LQ!a_RPooE@iI|9sOO
z1NMBZpekQkyS&9LT(uVhyk@RwY0zJ*CjeEw;Xq(NoZ`0@SalivIH2p}Wo6K*c!Dww
zuz%00v~ZCb^w6~|H@lUrV7=L;<ekyaWLt?P59u!<`0D7FbH1a``wHSuBf!$Y9<N<!
z_?dc!ohVqmG=P22A{a*S9C9UVdgY7!HBz-15yR4hKF@9!)Mvba=wBlE5`r%yc#%~V
zX2X`+3LhfxkDe^tOUPRGp6!d7eAhTw!F@yx@eKRi!b05w!Y(d+Ut{_DT$W+>a#67^
zm#}w=%8jq$8jp?szUT!)wz8*7{^nu28b}uiFJz#y;l6=+Ts8H>Wj+|Bc0HD@cwy9p
zLeaGn;{;?c_L<V1x@y9HQu>7z7y!9n(N7^p0Yp8F>+2gxeI3CN0Pa)0z1*kR%Vmu^
z8yUS-_K0rHH??si$jJ4|WBBZpGijAi`Fw0P5ipnwYA|-(UaxB;?CbWwk2eAp<J#Tb
zj8>k=uRW$afN5mThn66nr7X%fB?`iE{V_coNlRaHR`>a2QE=;y>$@Q#bPJ8b=bPL*
z!YM-n9BjNf@DCj9vg2YfiJe=Q7boeDi7!AfVxx=dh=IMo=$UwK^j*N(!C2MmJ!VbK
zJwVWoFLu#Z1e|k@z%!?mccJ?55yXFRR*5J!$c@8CSY5R()J{OXe+F&1ft(QTq+86{
zw-(pG^5}&}UkP0ZU8%n={ovqt58mi-j(0fEhb9*H-mv$cZu@Cc#&Fq-RnJ%5s;+-!
z?}fcT%3N`7`>^<8+zW9(%v=#kUNM!Hak~AEMW}R<k3WnPvL5>AHlA6%Is0}(+84H-
z*%~Qmz0!51g}ql@xUZ6&YFOJOjFGi<;_EiR-po#0TQ9y@r9-@iG*^;07Zb#5IbO%{
zdIM6L%+2Nct0cF%NPjhtAf9gk{;Nd>#LM-~m7{xWen~<KD#O_C3JyT=74K0zekj-c
zZkgvLdI5W_%`Qb=ci1ft;tLYoarrsIL!#wmL(ruhR8*7Z;fi($QOOFVB!O!-s@uyz
zI9eDh(%SuO_sS&Wepk>v&^xNu9?<3CU8chgAohs|45Pr^Y1UhRl3X7BS^Xb%<!M1{
zl;c?3Y#xdx5UM*C=ZEJV_WrW=hrfkaQhRX+eGP`tRR|tbJ<t;D<(Zx*`EqEoI%9f>
zR$)gq0-n_uBgWn7IARz9R0s?3^)adXQ)+{~I1Gz5h=;L=p}F#Q>>5LG48eB*gm}z^
zB6-jYmmDlY>={}d_@Bk$Cwx|%|5ME}8!j^hwxlrC1g7NiYO<*-^aP%d%MeFD;s<1^
zw&69)tCkzJ&EvJrSL!33+i!I48SmV4qtiX!>5kMkPt-~`Dy6XTL!*$Mb9?!kD+{jY
zM0WH{EO&%A{MIOJAv?$=(@5M{`IUyriVYFRzVN!6yL&J7j|^O~UJp*zY>)IE2yX(;
ztz;Lulvy~EHP&=x`=otiWN&Y{?dCSerN)t_F~{}v$weKJUWxs~^1RSavX5NaHL`o`
z(d(^~)m;&He|Y1~eSMdQ#t!qvCmS6R?_hYt&5oUyGVh-d7TQJ}giqRYU7TFBCE|1g
z=Ogmv%(1L14@b7|o~-MM91MgzZf@DZM>k$+owT<{_BdfXT|F?ev1#m{p)jL^>?fCo
zMh;)e2mMSg-Vy0P7~Xud$2Et>o?4Mt+C_TErSg%AvGyy$$;!=<efz`fZ|-t(g(O^;
zCTqGQvWLC1;$-6O%7&5MZva#4a|72)Sl2^`vlhwZzm#Nfk|&m~Zz5x4{ZjGuwpHt!
z*iRqI*v4~%QFE;$QU99FIjTXD_aEwyW*zS0KR`A-(X#<_ChH*WEw*80DH$5|uiQZL
zlaPW(6K+cAeD^*vyv!z6Rg&+rKdj2pYTe_kV0AV*Fxs^Gd!(iPn66cL1S0tH_+T20
z<ey{l(bDj^C5YifqgtZWduazU*y1(yxe39{7@zrALNp>AH-Em39bY3GbD$TlBtKvC
zxg80rj>>9WpT{p@ZKImE?AW}$eRF%qI-WIELq8218iZ2^mzzNz4Cxy%S~V)Ni@FE2
zGimhlZWUe$4nskCoLya8Z}}Ho<VOf@{6%wCxn)3hNl+MKA&3ed3=Sx$q?zETeL>o-
zYu=LaeLPuq0FZX#gxtlalcox6j5WWpL2q3WHoaS1c5djUm0`=f*?GfzCbI39T1IBh
z-9&BcMAf?S>~+@{j%RJU?i$b98aBL}S9s2Re(6MB-C6S;6HIX@fj!kSV}QcZi!JZy
zNDe#P*1YRk-0l<rc-8@pxV&EaeI&hyB)!k$r$5G~ip}`;^&MNct!r7^z0Pi?JOpA$
zRm}=q&Sc0RifZ6LQqW(ql=Z9AKY&if3?L>kNb6p|h5UN-)%A@;Tn=5VcGZGWU3-wY
zu_#cDemUq3xZz<ZFeFnN1{&WFCYnL73sMxW2!4t#su~AfRFNh62W%ur0iVm`cLFV_
z&_4ocPW7#(GqNe2{l~@%U51WjZVGGu_~Pi-HhsrH9%I3-)>NGRXnZF;R@nMzz-Oa2
z_Pwr!+lp`jo$Tk=PSv!-f6xz)_<UWy5}g1BI*9<QOp2b+HscC_s^-`Yql5km89rdE
zwpA?9P-w%i3_6dbsdN>4bX!h{YnPwHUm*W~BEZd212_rAT1?f$9w;6Ut=i*evtjcD
z0v`Wy-`Z9ANx)P+l%_nh@MNMIf`<mZvi9)A%YO88?LM7jMe#jKKzr+>8QAkOf^1gP
zU7W$w#EaO*EUj()G1k}JPFAsz?sOwBs-9!t>n_t(=te*6j_7jH+V?$J8i2rS%qI5Z
zo##m(3-79Ar*?hCcti&k<4IPz+ew<(=XO7B;O~^Itf$yOx4|IR-Ltrfr_W8e_-xe|
z!6tIpby~eL1o(Y*|0aQbqbJvhR#JY${<WvIc%<aDMXxTpv83&XOWNLPjCAk1(Y<fH
zd*6-j{_*bqh-Ywe)2CRyqtvvSP!d_v#`ZXRLq}oSlbNkK<oW#OmBMSJd4)J80`|sQ
zD-f^7m$y_2SL;YirFeCTi1;!Q=_?5ETwQ5yDc4^!WVICOujLzneyzxWlyZ1BBiAYk
z@L#Jkw`S_EEzN38)xTv$p0`pBKzS<@dE9LIo((BjMbLJX4;(_k^8Jf@s>$Q*>Yg`C
zQ7zF|v=a0e_zfK@Z2-~tGvq(NcM*A#P42A=ZNRxYaFC9_(b3N$ZlCwL1mmpslSUU}
zy$DheWFgQa;LdUmG4553i2WS`EMe#~2zZS%j2QSFynucS(QhLdL2wztTL9Dqd`R@T
z;TN=lfJ76Kj&7)mlE)pScs5i+pEuwNYDa{hj^~hzyGAjHtct-S@NV^w$ZFJnU!@hO
z53WJ<%9Yw30EOm~e-#krX>bvI(rdYukjsDmv`vV%--<TFPBI)CNgpp<dRM^4=$d_f
zWM#e~{(Q?F0lr3B$I`~!S6W{8TrU}4-4W^95!u-@-sKoy?T9RQj5qB05V`K^1!L+R
z9bk7>vv-`4V%&$OcJd2UqP<c3K~O<Dzr#(jZ})BvQLK!q1%R3Wk6m8R{u&+xDG#6G
zp+gWxFv)1D;)yvCg-ym0DWC~VNb+F_*Z4z_qL~igF|?<UBzJ(yHFC7>S7<tpvv8^p
z-f}};MKkXL9KwBp+dUiE#Qkt*pt*>G*#Z=zXbmUjA#(wOl?c`#XhG11fcw!N#3Tg$
z2o4~q#*K6DIf6~}nM$ssS<`XLeH^zE_IAiCucpgk2>c03C1IBRg~s=U+Hs+lRqwCb
znMQJl<E91pnywN_c6eY~fUoI9J+X!lPYduhouDW7;Vi`Mh?fs<K)if9!3>4jaMQGa
h-_uzpQXbwnEx^}wI+OPwNf|J~+zG!E@SDGv{x`ItuY&*p

delta 6044
zcma)A4NzRyb$)mE?Jm0u;$Qr;3(Jod32YDu2@nWaKnPd~goLy<TCMgyV8#C6`xYa~
zXpj}9RT4EuzO^IUYE3d~iY>dQvz-Jtb}XSf@id+e7*biUw&ONVr%gO9ww#XYwv(Q7
zpFpzfPP+r&JNMjk&%5v5^LOu?ACP~2lWh1|LV`trU;mxAM_%v0xFJ*beR6S=XNm|C
zkxao2p+rw2r{jW2p=3{TD8-W!O7*02o;jEnO82C5+7jFt%J5_WZI$AKnV~FC7N-+}
z*`XXy4yQK+b3=KayimR;KV<XRLUxZmRNyIqzC<Z0SQv7697K>4s8O1-O3A^ZP_d_&
z2s)udkW$VGQmUMDRgaSu1WyU)rU5ryE?MW6a_&apX57c!#JQQk&AN~4Gz(IZlr5Wv
z1=%Q<Wr5Zq9io&YZ|;+F<+358ly}bH*`gC<vy}gm?JB`n3)+P2pswJmPUBqF9)hQw
zzp4=W9I|75S`{aC&SG{%_jnRf6Z#MDYxB15Zfou8ba$}d>Hg(np1E#2DENKhJAy2D
zh$MJ)67lFIlcbkLNt6we?vx4U1<xVld0~i1#&ZcCpiU5viB%`M@=PIFQGCO)YE`1X
z=(ytbM<iJ_QaL(K!|ch#?&cSW+o@L#%J`T})i|#=5DrAWUYZZ@b&9H}$iX3+2Mx|q
z&0eoR=u;H0R}q0}x7*LKGseC74rrXpXb(`?Pkj@?HcBJ3Vog~gb0yg=w?Rap1pv%x
ztZCH;!cmID)P%b_{c<qq^*RYH2Cjljx{H<o(%dz$VTTjo&N<<hxQ)G+RAemWo$Pw@
zgKS%JNAo6Zq6jTR*bMN3K)Ddt^&oN)kfp={psK15#W+pqLC`c*Q;AYl2=_)-V-ukq
z{%^01ELtB~&F63-WyhYc8eNN{5w;>xgTPfIOEpJe@qN)iB&=FPz7t;99vYApYKtYN
zzDyD`L1q~K;kVjEli1JF-ZY|J&>igQ^n!f+E;R+mob*lvq9fj8KL2QBXo$8$#}4-M
zbe}aX<5K0N;b-cW(n?~@8_()CsQPglR89U!I4XyuY}nA0XHg>K)GvFnBW_eaIT4|f
z0;Uo<7Ktj1WF4MTO+&s%129Ijjtu%0i%qxSY!ba*UpO2AlY?&pW1()G?p}m_2)zh>
z0IC=aC{el}+x-X!5Dp>?ARIzCjNlPqFX=-_qHR*#g)eVWC-M;7vD;Z9(QKoW{a1FD
zu1xo2MqaEYXAjB9*SvX1lyc9B>kevTf0mn(XO~3usJjwIDgQo+0`?ENj@ClSE~iLF
zaD0<&g+NenPV_h=r&I{fBB@Mrz_VB?l1t=L9y7Q;saP)6G)pCNKHHslmR;yHlV{mV
z-pBfqXfnH*-;gvZc+D_({yS*`=0#gt;TM?>A)2-(QY6qcB4}bFim^Yp#YjDq?TwrL
zAmnyhX*xXVQG{dwHF;>wLA}1QfEPBIZef38-%_#xMSKW50h|U}g!EAWHBOPE(Li`u
zp?+3YkZa^#<X{h!XKYyW?-0l-G4@D7HK}8NTF^LL{%)@0rTuf6H!HiBD!Z4<dp^_a
zY$?;?Q`XNcf~|aRU?qPiw(h)_nE9!oGuM5Ty=g9EC40wt*SEV?4Z!$ZL8E`Ad2>s-
zu#l6CSf1T#(cdr=KvjP{atyp9P?(@gM}y-ArN)JPV_qc?m1zU}R#BOif5a$u?_t-9
zT%?2<ii^n;vCYK^#F~x##}FoCttCIv=bl0uKZRoKc3QY4YnB>j#bpoFG+<u@VGQ9B
zluFW8iofJEay5-e?LnaI8)aM56(pkw;|Px;Ot7W0ESS=7%Ie8%taS6kM8py7Tjhi7
zqb=1LeDcUqa5{Fo77D|#@HX8of$b~*l_v7dFN=(^?h1$Q1A#qKQEL1K^wQqgA6Gm_
zh>g`f`28+iB|0iaCc-ZeaOemP`J#$b&v#!nDiFTMWYsh*gYQNuWCq9;%6KrUeP=Je
z3^T3$%o$q3Y?TLfs{)&-e4-9x4L2Uzh*T56ni=6B`V_(+BDeq)1HjRvkUl`muBuwy
zFNN62szKeZr-2XS&Z8h-YP84uREqcJK`C}|Z6Z*h3zcoG*{b_oU|lsouvmcmHTb_B
zX4Y+Ia_Xb&-ZiO{^pb8Z3)2eLl)sVv<u>am7~N_8eR6t9j3$5z{+raV<@vRd7j+l1
zMZvE-t=|s;dcROBTxj*{2<J=);H>CZ{0Gija$1ZgueFb-u*dULO@>MFIYBbAZMBue
z#71hL&cq#84Z%Pt5Ow1-JgRU@VsYCWk6N@{(u1ATqaa8xBQS(NLg23Or4_sD%cz&H
zKStc}=)GOQb%TY&?(^)s+wD{Fka-nU{7=H2Gs0?`)tvQVj_vvSXX>ACdZuYsnJ;={
z^Q)V0)^#n_bzN#&&gs6H-hICP?-SE6m(G;Tmd;hLWN-h_wdbeZ*Sr5Vqj%nQ*)${0
z$Pf<Ft{(n*X6-u}y^Be`@1~}o?_9MC8+*v-pT-H9edNwZ7z^}fR=K0%NDVnx-J%!f
zNppkvY5`E!v-6r8#p|^?q<4^(8gjjkAYISt22M8`fU}@Cw^ZpD;&WQc^$Vp0=}iWZ
zUnn;qU8QfSiM_t#*JNrJe4=U`_C-ga@UaAxKp0A-uwUj0gg%bF2`xTFZad+Z$1smM
zO`7qc$MHQ;4N;#ms;DN-MHJ1k(a06ZAp&37wY9wfj8nGt0;x019xjMu6%Fyk5vy-F
zuFJ*R#*J}%{fG98dwYA4U2i-~z87;f{Z6MRlX2{LOK02Fm-Q3G>2T9&5CNwKhn0L$
zAMJ)F?Lqir&Q;A?em~IH%`-30xopAEH^q~xYS9YBR;UlP(A9-Ho<QYVc>SDg`9D)M
zjNr)`ODCsU%P3Exo}&mC5xBKtj;2=-wg^-327@vd3`CvjT7-BJJN~!txK}&;|EdO1
zb+2eBLe1z33T8%agIK&P3F2^`t9Pm$P5*g_w|BVhziV?m|JXB+-LzFM*(&E8^U*gR
zd-buKO?^vEeT%lrW!wInS^KArpBja<?2l|EGmp-mny+5A?V8^GiBV`Ko#b-I%<kFY
zx#&u6!&}mH+pX^YE2XoW=6bGGuN3ZH^c<P)0>M_&MJ^A_9GX2bpPjan*SNT^f4cov
zyZiFQ%!#?|`TiAK%VPf_7T=aTwTJYPD;cwybM@E6m4dd#frqB|{13_L-M3oy+*P=)
z58l&G+=T1Qns=?(niuyEfMoCCD+9BK=BC~fSBiTUz5Z$Ut>#WXcw$~$$=mr>6z0;_
zqm8S&HxTr>$w6|Zc6R&R;5FBZqjT{g?{xRAo&#TGu@BmEi`z&KxjZ~GGH0HzUdi9J
z*mrQc<5t&xz82lridG6c77q_HTl-o4hk3>9mG%>v+5O}{lqA@puhn#vka^PK5MOQI
z+)=`sI?@MtiZE(k%Cio)qxGn#8YKDH`0!ft!Of;WMEJ_&gB{-kIAv$O1*z=E9SNi^
z_IAf^l80fRS^?ld(hCoMAh{bTr&wiY8M(k7?#$L|%q}+BnML|zPj~(`DQ}$AxrD(T
zkV-63j05~PX<17i_w$aYvZc;cHg+hHz1fwVV~wI&YVzhu>)IjmwE03k`=m=YVoe0~
z|HIwi+-FsFR954L0$~XY9@X4)pu4}byVKpq^QLMTrjhY6a4a}UjPYnjzXPKo!^=ME
zA5o1#-lIY;IpK__U97%mYs2fP|HlY#psX3sA`%3@5!Eyz`y{9Wadn}s#6$nx_{JZQ
zdFOk2(l4R|<pDtAh!b)iIG+fCo@KjVYtSWBO`G1!%Dpu3T<%Ny*^XD-FSwVtG%Ro0
zxs<i@TES9g>owm}X2-PQy<FRjdA4RbxALMHO2LGxRSV1Cdv~3?V~u;?){#tR?Q0p}
z^}#iqs0o+B7Yx!LK#TqqS^7{QOy9)j0yZt39qzq-ZLQ7w+aNCS(1rm9f+8G$WQh8T
zYTySR`VPC&*O;~poeI_q>mLbU_-}nZWG?2~UrR`7Y_k6k$Po<Dsxd4_gAqSu>&S#m
z=?L)nL@+Om1$~fF@Ks=tXp5?G%tsYjqQAmMyc7xf0%0%kq6+;-VDZXmZApg@HtTK@
z_Ts^5&CDiZy9Rz@Aic~q=t@DQr!4#6aBm-?k&vDCu))ECzP+edCx?0XS4{`PqhYA^
z`0Mx!=#M~vzJ`E>CB;2&zkk!$&j@b%4hk%@#lcM*H4@rRgQ^Qi+7iCVHXO;G;;YI1
zY!T%@K)}h-j}h>otm<J76n#M}>i9PC9CZMBeF!*jEoFItQuR=QY8he>n}+E4SWwmu
zeOpixjhUY%)$9cP{D2bCYFV0!J&;rcn!&CgaisH@KY{I01U}nd_U}hJb6$kDVg*>=
z<h5-52pja4=zdLNU-vHRa!NtO4@SNI!|Ih+mKHX4Y?itF-xZ<s8)d)odr2+plAf}t
z27fT3$Zm)$iE`$Xa-0S3Rus64fjWXE$PXO$feIQ2O7AP0=aFXyo>Qk)8ZKabq5Q`I
z_g%AehKFS(3O6nMW!12s%6sf7*_HMerE681d#TR7xNl&k>Ja-+xmdsTFkzd9j!vBf
z&1W-Qdh%>uOR?}n(&7;3MW9}*1>W`Q($;i1c9GUpaUoYk+O7xwf`fp_Lb16uNxx8$
z*=p6_FdBe=!)gG|jU<%0kxD@RM!MN0=x^j_w$|%!Y~wQZ2H^aafHHo<RxN2PcX(@R
z70d$yEbh@-fMrLA%SkKy_VD#${9NbVl0O00Y6AjXI|_;jBXHZmEu$lwNe7!5shlc6
zZ92+Jsk=|=MV|93uPQLu(uWcF`PYF|BEm)lJpwnT6G(BZD@W@05YQ@V7=hO^{6sj#
zjq(yQpGDxOm<vc@ic#aS!V37IQX7d#G#>eArm83f{87~yId)w3M=AP{Y8VPed{NDn
zK1RVu5V*Nud9I4llW=47C&*03CBbE+r8^OMC66D?zkC=7<un+^*Ws3{^~3m_WijX7
z`0Qmd`xDV_sJk>Zm$qc9xh()4vmPHJCAkL6Z0o83k2%+T>ip1r&Qf*Tr`W!&7mO*Z
zI-ph?*vq4f4s;7`dC5QHVmTk+*KKqc^7$$78k-4rPpR>6r4$SttKgB3@|Y=(k3$ea
z-_sU?XWQRm6SqQ5hVO%H<CRZ9a7Ld|w2e8663Hl$=#NmjLSC!Q6`F!vE9Zuwh7Bs(
z-lbuEsojI{UClr-@fg(g6t8D+Qz8^%Xa#5SOMzVA^D9Dr+s7~M@TTSNl@l*H_@47c
z)>a-z;KF|%*8ndc56X?S5JteCpcK6ixT+_F+!A*DQrPf!_-Fow(6l5py)P8}LMVJ+
mu(KWEE%63YI(_6b0Un<vu^)v`CJ&oP&ZYR@3i#yLh5rrkk?ZXM

diff --git a/ingest_pipeline/ingestors/firecrawl.py b/ingest_pipeline/ingestors/firecrawl.py
index f734f66..7e0275b 100644
--- a/ingest_pipeline/ingestors/firecrawl.py
+++ b/ingest_pipeline/ingestors/firecrawl.py
@@ -6,7 +6,7 @@ import re
 from collections.abc import AsyncGenerator, Awaitable, Callable
 from dataclasses import dataclass
 from datetime import UTC, datetime
-from typing import TYPE_CHECKING
+from typing import TYPE_CHECKING, Protocol, cast
 from urllib.parse import urlparse
 from uuid import NAMESPACE_URL, UUID, uuid5
 
@@ -28,9 +28,70 @@ if TYPE_CHECKING:
     from ..storage.base import BaseStorage
 
 
+class FirecrawlMetadata(Protocol):
+    """Protocol for Firecrawl metadata objects."""
+
+    title: str | None
+    description: str | None
+    author: str | None
+    language: str | None
+    sitemap_last_modified: str | None
+    sourceURL: str | None
+    keywords: str | list[str] | None
+    robots: str | None
+    ogTitle: str | None
+    ogDescription: str | None
+    ogUrl: str | None
+    ogImage: str | None
+    twitterCard: str | None
+    twitterSite: str | None
+    twitterCreator: str | None
+    favicon: str | None
+    statusCode: int | None
+
+
+class FirecrawlResult(Protocol):
+    """Protocol for Firecrawl scrape result objects."""
+
+    metadata: FirecrawlMetadata | None
+    markdown: str | None
+
+
+class FirecrawlMapLink(Protocol):
+    """Protocol for Firecrawl map link objects."""
+
+    url: str
+
+
+class FirecrawlMapResult(Protocol):
+    """Protocol for Firecrawl map result objects."""
+
+    links: list[FirecrawlMapLink] | None
+
+
+class AsyncFirecrawlSession(Protocol):
+    """Protocol for AsyncFirecrawl session objects."""
+
+    async def close(self) -> None: ...
+
+
+class AsyncFirecrawlClient(Protocol):
+    """Protocol for AsyncFirecrawl client objects."""
+
+    _session: AsyncFirecrawlSession | None
+
+    async def close(self) -> None: ...
+
+    async def scrape(self, url: str, formats: list[str]) -> FirecrawlResult: ...
+
+    async def map(self, url: str, limit: int | None = None) -> "FirecrawlMapResult": ...
+
+
 class FirecrawlError(IngestionError):
     """Base exception for Firecrawl-related errors."""
 
+    status_code: int | None
+
     def __init__(self, message: str, status_code: int | None = None) -> None:
         super().__init__(message)
         self.status_code = status_code
@@ -64,7 +125,7 @@ async def retry_with_backoff(
         except Exception as e:
             if attempt == max_retries - 1:
                 raise e
-            delay = 1.0 * (2**attempt)
+            delay: float = 1.0 * (2**attempt)
             logging.warning(
                 f"Firecrawl operation failed (attempt {attempt + 1}/{max_retries}): {e}. Retrying in {delay:.1f}s..."
             )
@@ -104,7 +165,7 @@ class FirecrawlIngestor(BaseIngestor):
     """Ingestor for web and documentation sites using Firecrawl."""
 
     config: FirecrawlConfig
-    client: AsyncFirecrawl
+    client: AsyncFirecrawlClient
 
     def __init__(self, config: FirecrawlConfig | None = None):
         """
@@ -130,15 +191,15 @@ class FirecrawlIngestor(BaseIngestor):
                 "http://localhost"
             ):
                 # Self-hosted instance - try with api_url if supported
-                self.client = AsyncFirecrawl(
+                self.client = cast(AsyncFirecrawlClient, AsyncFirecrawl(
                     api_key=api_key, api_url=str(settings.firecrawl_endpoint)
-                )
+                ))
             else:
                 # Cloud instance - use standard initialization
-                self.client = AsyncFirecrawl(api_key=api_key)
+                self.client = cast(AsyncFirecrawlClient, AsyncFirecrawl(api_key=api_key))
         except Exception:
             # Fallback to standard initialization
-            self.client = AsyncFirecrawl(api_key=api_key)
+            self.client = cast(AsyncFirecrawlClient, AsyncFirecrawl(api_key=api_key))
 
     @override
     async def ingest(self, job: IngestionJob) -> AsyncGenerator[Document, None]:
@@ -277,11 +338,11 @@ class FirecrawlIngestor(BaseIngestor):
         """
         try:
             # Use SDK v2 map endpoint following official pattern
-            result = await self.client.map(url=url, limit=self.config.limit)
+            result: FirecrawlMapResult = await self.client.map(url=url, limit=self.config.limit)
 
-            if result and getattr(result, "links", None):
+            if result and result.links:
                 # Extract URLs from the result following official pattern
-                return [getattr(link, "url", str(link)) for link in result.links]
+                return [link.url for link in result.links]
             return []
         except Exception as e:
             # If map fails (might not be available in all versions), fall back to single URL
@@ -324,43 +385,43 @@ class FirecrawlIngestor(BaseIngestor):
         try:
             # Use SDK v2 scrape endpoint following official pattern with retry
             async def scrape_operation() -> FirecrawlPage | None:
-                result = await self.client.scrape(url, formats=self.config.formats)
+                result: FirecrawlResult = await self.client.scrape(url, formats=self.config.formats)
 
                 # Extract data from the result following official response handling
                 if result:
                     # The SDK returns a ScrapeData object with typed metadata
-                    metadata = getattr(result, "metadata", None)
+                    metadata: FirecrawlMetadata | None = getattr(result, "metadata", None)
 
                     # Extract basic metadata
-                    title = getattr(metadata, "title", None) if metadata else None
-                    description = getattr(metadata, "description", None) if metadata else None
+                    title: str | None = getattr(metadata, "title", None) if metadata else None
+                    description: str | None = getattr(metadata, "description", None) if metadata else None
 
                     # Extract enhanced metadata if available
-                    author = getattr(metadata, "author", None) if metadata else None
-                    language = getattr(metadata, "language", None) if metadata else None
-                    sitemap_last_modified = (
+                    author: str | None = getattr(metadata, "author", None) if metadata else None
+                    language: str | None = getattr(metadata, "language", None) if metadata else None
+                    sitemap_last_modified: str | None = (
                         getattr(metadata, "sitemap_last_modified", None) if metadata else None
                     )
-                    source_url = getattr(metadata, "sourceURL", None) if metadata else None
-                    keywords = getattr(metadata, "keywords", None) if metadata else None
-                    robots = getattr(metadata, "robots", None) if metadata else None
+                    source_url: str | None = getattr(metadata, "sourceURL", None) if metadata else None
+                    keywords: str | list[str] | None = getattr(metadata, "keywords", None) if metadata else None
+                    robots: str | None = getattr(metadata, "robots", None) if metadata else None
 
                     # Open Graph metadata
-                    og_title = getattr(metadata, "ogTitle", None) if metadata else None
-                    og_description = getattr(metadata, "ogDescription", None) if metadata else None
-                    og_url = getattr(metadata, "ogUrl", None) if metadata else None
-                    og_image = getattr(metadata, "ogImage", None) if metadata else None
+                    og_title: str | None = getattr(metadata, "ogTitle", None) if metadata else None
+                    og_description: str | None = getattr(metadata, "ogDescription", None) if metadata else None
+                    og_url: str | None = getattr(metadata, "ogUrl", None) if metadata else None
+                    og_image: str | None = getattr(metadata, "ogImage", None) if metadata else None
 
                     # Twitter metadata
-                    twitter_card = getattr(metadata, "twitterCard", None) if metadata else None
-                    twitter_site = getattr(metadata, "twitterSite", None) if metadata else None
-                    twitter_creator = (
+                    twitter_card: str | None = getattr(metadata, "twitterCard", None) if metadata else None
+                    twitter_site: str | None = getattr(metadata, "twitterSite", None) if metadata else None
+                    twitter_creator: str | None = (
                         getattr(metadata, "twitterCreator", None) if metadata else None
                     )
 
                     # Additional metadata
-                    favicon = getattr(metadata, "favicon", None) if metadata else None
-                    status_code = getattr(metadata, "statusCode", None) if metadata else None
+                    favicon: str | None = getattr(metadata, "favicon", None) if metadata else None
+                    status_code: int | None = getattr(metadata, "statusCode", None) if metadata else None
 
                     return FirecrawlPage(
                         url=url,
@@ -373,7 +434,7 @@ class FirecrawlIngestor(BaseIngestor):
                         source_url=source_url,
                         keywords=keywords.split(",")
                         if keywords and isinstance(keywords, str)
-                        else keywords,
+                        else (keywords if isinstance(keywords, list) else None),
                         robots=robots,
                         og_title=og_title,
                         og_description=og_description,
@@ -399,11 +460,11 @@ class FirecrawlIngestor(BaseIngestor):
         return uuid5(NAMESPACE_URL, source_url)
 
     @staticmethod
-    def _analyze_content_structure(content: str) -> dict[str, object]:
+    def _analyze_content_structure(content: str) -> dict[str, str | int | bool | list[str]]:
         """Analyze markdown content to extract structural information."""
         # Extract heading hierarchy
         heading_pattern = r"^(#{1,6})\s+(.+)$"
-        headings = []
+        headings: list[str] = []
         for match in re.finditer(heading_pattern, content, re.MULTILINE):
             level = len(match.group(1))
             text = match.group(2).strip()
@@ -418,7 +479,8 @@ class FirecrawlIngestor(BaseIngestor):
         max_depth = 0
         if headings:
             for heading in headings:
-                depth = (len(heading) - len(heading.lstrip())) // 2 + 1
+                heading_str: str = str(heading)
+                depth = (len(heading_str) - len(heading_str.lstrip())) // 2 + 1
                 max_depth = max(max_depth, depth)
 
         return {
@@ -570,7 +632,7 @@ class FirecrawlIngestor(BaseIngestor):
                 await self.client.close()
             except Exception as e:
                 logging.debug(f"Error closing Firecrawl client: {e}")
-        elif hasattr(self.client, "_session") and hasattr(self.client._session, "close"):
+        elif hasattr(self.client, "_session") and self.client._session and hasattr(self.client._session, "close"):
             try:
                 await self.client._session.close()
             except Exception as e:
diff --git a/ingest_pipeline/storage/__pycache__/base.cpython-312.pyc b/ingest_pipeline/storage/__pycache__/base.cpython-312.pyc
index dcc297631c3a0ad636d09a2aaf870e0d3a122b2e..0e0534a13dca075d5feeaf270c8b7295e3d0e244 100644
GIT binary patch
literal 14107
zcmcIrd2kfhneU#No=bB`qgz6v5ePgO1jLlh3L9G>z}O&TgkvKg<JNRb8Zn35J!3o*
z$?L)-C2tOs-E0uCQz5C{jaZUhvi~fpN^QWEs%2{{wKI{cq;%mjsqE#yc7nW>ILROT
z`(7V2BZN(kZ8Wc6zw`UP_g(LMkADpY{T!Z`j{JCHU<=3noIb2aFf+@)LgpOz6en{d
zoXpFPBtOFA?MymS&JkzIHR9r_+?5nk?h!Z33rSDPJK|+|chZ;gkN8>Mk*pi3Lt9TW
zkP40jQRbC>$xtdh5@vaSvOd)?(vXUbMDSfF2hg{1q%qYr(!_HPPT?mvTi{jRO3NkQ
z_!?<dylAt%QfKAbkx|;^;DdNOxPzP=I>X7~OAe!cq=S{!qpU%3UUHhHoq0zzQfS>P
zX^N<2GpaPMh>3JoQOBgX()R(i8j3n}=fK{5dPo}8vZ@r%rj+bNMvn4&Xh6%S;|G<r
zqDttD65&81EhUi&9!E=MREnQGo}W@s;2T!rs*)Yfsvi(YC<zQ36Yf`4^mXXo!Av}t
zQqoyHXx8k@q{kBD9}w!OZ`hYfCY5+Lkx38dQYlHz>jA6Fq4ZcrcOQP@;KBXJ;smwz
zM9j?cag1_~Q#dRvH{!rj^CM2hHOZL6YHYj}x9lJyDjwvVl#^YufS>zqr|eNYvRCoS
zu7U^UKE)^d6+c>f#vHT&M){amt~=uf8wAkH_!oRzkVEJj#;;xpU=gTSu)3EVS*5Iz
zm7%ACo?}j$qoz-jF}o5Vcxq~zft`rvD;^WVdbtG<HppFa>lxQbMDCW`@NSgbl_sUR
zf{EOrG@H0~DlKLXCBSeE+PCIi(Y1P*mRNo?o1NO1Okn+_gP^rv#4{jHshKH7P3FZc
zwGkgZe*CByXRX9jsx*Z<aV(><@@M+|tkY37^KwE~G%=n@YY8oj5k=*dxH3g6FHT5l
zIhjb0i+Hm^kx6H=5>;xfKaFScvLs7W;ATzCPDoiX2QFt23>-bAnX?ULvP!==oJlFh
zXz>Xpev*3Jb2Oin(s3m!rlh>6DpMIXE1r_nG$z+XX*83|8ep@2#?*2Sqh!QnVpIit
z0)f;N02@st6WP3&(6pSQ^@+zP6x7IyIF?H@ZYE4s6`Tz+0ZKKO&L&byA45iW8`RQ$
zu~7(VET<-i#*HQ2^GMXGd!(sE?4**{J=6y<>7EHil7WEkwK}NH=%BVx(uyQ*ssxUd
z0I5KFFMkQiIc}Pt=3>Yh&$R0mUUTqVf}0Vh9cqirPdg?})nT=v_a*b=E$-`%X~B>l
zj3i7uW#`+@8F$uFwA`e-x}TAkg#<V4{ww}VG`GvD2WPpZH5MZgGaX7NvI!}fD1gQw
z;cX0ME-2$WbzJLb^rJ6&EL!x7OxHbi>@edyDVfC5zJztj8Y^hD7Dbb+{o)gh?WCj#
zo)JN4qgxITV3p#G?P?}6m!V%gW(+Hu1yHM^rhuj8+KJ57>K6xO8Te(OK1H*PSSgW?
zCv)JHQ;F=v?T{8cdlgBA4C%oEfRs@a1qM;nskVWTY`NLO4_)M<g4%>Ky?$KD#sCSF
zaqML&nNxIO0;2nhUdOb#A;M}SnnpdkOH-0###psXq=yW?j9J_kG`~+mM8-7@+K4l0
z`Ro1LCLmthUY4}D0%1)k+n^OD!SC8O7@VysDGjruZi8H58Ddk3DFp(qY%^te8!cVm
zR9^SSVhON7ELLb+p>X=Fnst~}djZL7T)Btq=$UnWAyjsAn|J(e*X6ylp`X@8mbO1|
z#k08UXld8cg<Z#r4-6Okj?WIwJzNUhTlRD9>y}!3ms-1j;c@Nd{j<Rj{aovs#g<Ja
z`r9?X70ImYi*?JGfjbZtbRYO9b1JrT`%c|8sb$i-OO~>dE{r9Til)1#Bvne`Z5T}5
z1!XXy_M)%4k&;c6+(SteiSEXV<kWQB5-<`PAAYanxBLQx_HmAfi2Ar`ZW2W+pVb5t
zLg<)wK@i>3p6~FNOyPT-lO3PIEMIk=bAC<`xEb%XchVNo%D9$T^W3y|n0tWxLd$wC
zYYXrOPQ5wfn|7*uvjio3rhT&0@;KD{vvrm7$$*uwykQz0mM0<$CqW5yO*UlJPc~S&
z%3F35Mphr5I{{2)e6RZQj%nYdW$G)<xk=*q70--c_DuU<<}|PDWp9`4qqmy910IK~
z%U8$acf#3k!9P=%C4I~uxo*1dElv(#ZAo%hJg5my`=DOkm!J{pnf9G_RP_#hLO)k^
zztbkwPVuL>SDYufQ~Y<Gr}$`C`mbtrdlXJ!Moq!I8aC5ZlZGa$HqGR|*=G4;m9QZP
z{l<94hj`Dy{l~Y6N1qr*I=KJv{^R?%h)Ooz7p>8%Bsu*eX>H0u5hkJMUS`JD((E<u
zZMp0h4~>b()ts^gok+aIp-dX47a&7wQKn77Z-BFrNW;^RWHB=)s!~FOGO8JH^JYV_
zK~JmW%uCe(il)J*ftF?p)Kbre7emVL7@Kj0C1MVUHLsW%B}KSJ1Uw9|#F%Kq{t&^<
z{2UGbO%5<>1a#H-0908qe6>@}khj)tOiCmxrYGuJO$QC>UJEk4&X_btu1ex7;EclB
zV~Uo^sc}Vw!vzxN;DOx(fTI0kuZBO}MY!pneVKF`Na-Ha1nQn#`eZtDDqRp5@`Zq?
zFs2z(Gbyp)=obqS%UTkY22G<uW`uN)iGW^D>!QT4bTI=o-M8Oz3*q%hnv~6|x(DWs
zGHM^BM6E}n3$ikr8;1uKizl&Uu^5?>w3Jd}F_rv(W*4IYbuHy-_od!T$(<B68(HTS
z-OsRKBdOcaLn9q$8a?(>duW`UND8ehO_qt(Uh4NLQ1`#NU%_bYZ1zQ#y4HQ;+4IjX
zc5N?pZC|QynR8v(IWJ%7z3whMx$YgyoTEGROU}_2ntc?uE!eym=q&|$-wkY9YV4eS
zqU=M>M=)IV?YFqFFY>c++uKiHcyiwVZr6Q3@Lc8p*?-M{{YdfI*ut(Ci}LtSc8%Yt
zZ#ftEa-i6?=c@a<>)rYzH(EO}a7X7iI?s15wr?%9Z=HQ?Dcn5QQ3|iWkiYy`Y15vo
z(d&iM-V-+(JLY!GO}^V0{m%Gh=^rP*H+gmIyM0G*^hD>^{r%>Pn=hxXo>=I4;_Tx$
zIyTNX&wpk<b>+e9u73;tOQ?A8>EhETiX+b!Pdr!L^!!4{3q@HeHYxw!v9TE4eP!^6
zL*E}N?tc9Gr>;xahl`t@T<ADfeC9;4>BP-I!*9xKf!J>~qTOkJa4Uai!vN3C^AEc&
zHY4*-RP;k0xof;{aI^E8|KY)2=Q}<D#qWgnw&LSQy#gwJwAqQGxT#SwnBfjHd;53z
z_}%TTWier4`DzQxb9o;2Q-J-n9bDK?afYwh(@EQkGDuh=JEnQdwlHhQ&+xDEdBi5@
zy+VIG3tRRjGuYygcgzIMaLJeki6`ND<)%pCF%j1Kh6-J5=Z)=HhSXhk7ZPari{u3A
zZiyNw>izgI<jG_1f}##XWN3@5!9U?dk#W2(upWixl|0XiHEK;uXK=jB>3eu7(sJ(J
zFW<Wu*-(mXScq&~3~c;KVB<$O!fm%W-uLj0K;+G#H-?Ix{Z|GS1A9t=J-;bCQT|(v
zU^>kYH1lV=qTDz6O|EabqTJt5!MFJ+chNTxasETgK+t*3E1>LJP(Z=8h!gpmRVUcl
zs+03!tok%J%rUFT7uGPpn0BLC<&`XUgUnqO;s2}oKD85FF7k{J8gY_I0)H$fp@pKt
zUF}#&hpIaC(8x_<#JCx5oUQw4nONksQ{Z(kw!N_|HqN?-a`4u5H!B*A+iZlkaODi}
zA3??ff3ljbQBKco?CCHZK#M&Y!j3}c9T0vck?k9b^6CJFg8g9X@&NMcK}sG)q7hgk
z9)k~{aU})4K!f(xXuzsorGDfG8T=69!i{fEzA^dv<f6CZC*F=<Gp%~Mshj^Qzs7aW
z-OXQgs0idyT#CI_^82D~>TbMrkUf==b4jRnJrIk%l#`N%qSrmKn4F12<9DH*+D(na
z0Iw1|Ko2M4TdJ3;gt25s%EFyb#Ix#pDshcwG9bTUuXQ1tn@VEmG@8%C(f7hIGB<+h
zdPX00kac2<7o;txZK_n-8mW&_LcF7HprnTqLWCtGciJcx@Uz@69A3d&ZsLNG#Xwgn
z(6!*|S_(&AA1Vj9-sn<$*HU!rt>9YWPi{t<%L3kIFBj>YJ6>v7SN74TpNq7X>nIoC
zA}wd*bN8K{_;UA!4W)*S%ha!YnCCi0j6#3?dzQA{cdK!m5V=|3SQhYx9SBFt9?JQ-
zrnYh&<pNluv-i!p&+aaT)?%p8#&VF#Y3Wv!hpD`tt8Y5HZ?1VxyRd)$zPUdwwQnmn
zZ7YShU*1^?KTvL<HW99&`RwrA`U|e}o6p8d^}X}1QvH@P!2<04;WxYA=$_k9@^vpa
zqiA`Q7lenGLk^*-?DYtpH-XwrDMFnhTgn1T0C;5Wg{D$NZ`nhiUaq100*2gB_R*)G
z^M^jHL(U*SQ9h2J{aCw@<re6M+rx&68RU>1ifhavI}r+VBe3UEy!aB%xGX^%@hN_}
zNA^^e)S<*Jd*9{}JPaUs=#||plt_Ku6gIT`2JMysC8PvcP_DXtNb$08pj!@B^$MG#
zqqb)BfH4o|2qW-Uk5=_^!`lu7C9B&-lm=iCL3pnbtr~sUZOZG-5u4Dm8TBnnQ_aZD
zz{72X9>@F$CwfL&Y{+Xzr;*(VG*)nIHOH>Tt6|I~w`2A;Kw{zOkUK!*c2?411VQCa
zlyovkXj~TyNUkx*>#};*K-z`adBlX&Eq7y%Zie9ovln5v7Qbp}Ldse;pH~)vnTXX~
zhk4iK-O*mXjs)9uxC_w%Gd#{>O|YtPHQ7F6Wh}A}F+CR8wgYj*c4UJ{kuMW3t_;NG
z`KY5XW^YKUB4H~A|Jd!9F)M<dW}x5r&LMV>u#-JFY53;=gJs<*Uv1r)IxI9*p>Bs?
zzDP~Un!%F|ajjhxD=`F&6n2ftB}2i`9YO}^t{&1LqO5pU3slgNjpZf{b5Unu{i8XU
z>8&a@bkb-N`xQ9*Y%QKTB+3bGDk<grbdN~~9X-^3Ok<c3>^D#!SJZtdsy68XvnO--
z3vJZ|sIK`cbz6r7L~uj%z4_`JuP%l+mckns!+oW2-+cZ`&qDa2qW2+2nxPu95W=tH
zw@h0J!<6TZ-MORiNY%2Fi)Sr89kM9cicvruQ9UV3;brTj1e?Y&F|8=FBKHj$24^K+
zeu}CYfz?7wHCC1Kw*XDWO#xcIpy{SKT>M2|4_78+)X}}LwQQHHj-#v1=;V`p9EzW}
zxscWddtZ?}Q!Jo0+{f~_)u>+_G-s#1Igv@J+B2`VC%4-l8nhuWs0G$we$E6SXSiri
z<ZKT|V51irs>#NRE}+#iiGtzPv=GHq1>d^Q0#mzdvdr5+8DvT2lGz0O51T9$zJS`v
z#wYHIKw7_e7zZm9>#%{jTT-p;C>|QrZ18GnmIS)1&<ueEtO$-X0IqTLNLV2R+*eic
zUG%NuxQ+__>MW3B3Au)Xq*9pdkV-LRCrb>+9w?aAlnM1&@gUa5f8BA(?0MRhJ_#qe
z#+eqmw+QU02?g;d$tIvUng=PwdmwIFZi)_z5XL~6DV@=~S{R^I#k^ofo3g8hl5DoE
ziXPdanX104go$wMbtnZEqVrZoW*b2kEwYq}oKdv&rmTev1<wd$DQQDgSP$H58(Aw;
zX?@YDH?A^OMcrOB<tu|#ScO**jxs1+YjCX6AE1{;v2-S7A9i!$o(spn{lYh2SnPeU
z)cas@!$ZY~UM%)V3!%}Xchpo_>wEbR$p43dBju#mBbtN_gEU6FHCf7Q>M0c4tVL{N
zvsMeZz+f#FhPT-ZZOn%P)Cjek%ywI--8Jocjn6w}yjNpLgrN`Otl3Q$4`zgvW5%6w
z&3F)iU$wRDBG+WbTNP;cPP?tS)t+fD0`%_5paomyJuO%a?%<|9)6VaBtnUIMVl)0}
zgv3w6@(*))F9H|OBXD84#2f+_P6|fkoi*WOpLDERME21+DjA<D5y4&%=WNVSA(Tm+
z%1Hlvi3aH_c2;XMBnjpUJJc^$?hM!+pet+otXzKTgo9_Cp;m;OwGkPMAiM(L;a=oL
zVwNf~Tg|et5H6@-i^d&juthu|B@w&Hz_P2S5a+Z(RL8JvLkDyp9V7yd)Raohg|lDh
zQ^)tg(!$_VmC-;}l359tD{v5%*N#WMY8GvEFM{oGg|d?R8GNb*N~Wp8Pmyj6igRw=
zi4ZM|@<i(ln`g@;69|==K-QHF!ukhopkmk=t9csJ9nWPmV`EHv)0&u%5fTWnHH#Tk
zsCA;MYkrJ@v<pZK^SLJCYp1a2^XH$R-+eti_xwWFGmEXy%s#plZY_q_F14;9SF3Yw
zVzGN$34h^j@7F(6s()xnyk}9|Q4)7tzPBXqIUBsu*fp1$f9BoB`<KM6XAdoP^?u{I
z^Uuw%U+C)lUVHJ8qwnr`vefnD*#k?R8|K}m&c0$(9|p$0w~K2#!G8n=Ls3<Sul;9@
zZDj%P-)j2+<Y|7dk3Z8g(9eC1AK2x3%Z=POsq9+=O~_um-+}zKT|DLceS6)`cbru6
zj=)pi?L=M|a0rbXEkZJpN@TH?6NuDJWRkKS=^<T1ddP|2GKF2vaeoZ+7IjERs^xYV
z2g>mY<}6!0i@OlNmsMjJVY^|B$i8f@CZ=Gh_KQcPR}!gQN=)ZcqmVf|fKfDfI2E^o
z8ruZHfFMy)Qt3{GU0M;t6A2|LuQ(JrLcRvYIBk?F?T`HttfR(Iw2>>c-eww&7V1k_
zHw0FhOL+!)^|O?GjuNs(8lA!twq^j$ZFDO{YWzz!+5b@U9we`EA8uLA?j0}oJhc$|
zbkX~1w$HHb8SxP*kk|2BZJY5IHX4IUQo&}TqQHMIMO{Vdk5!OtG8qm>Jg#WkST32&
z+mM($7Zy4u{;v=S`VKJG638fn)#TKZXw2MhdzbY|=vTHN2bC;r27CjXYhYe*H|MUT
zVO4)^$mVdH54VWh*$$0tq2)H(Xfs7`M3~J`J7W@BJ&QvG22$+?gcUUb(JBWz#ML(#
z8xWfk7^T7pWZezNX1o&le#?f0dHvGMIGkhq>57@XJKeA<HLRUPWiYl+*Kq!unu2U6
zX^R5I!~BHXX~Tl2`v7+J9=)DA;mFe7{ub6$i_Xg0E)Z#%+#@UYTpyYBeWdP3$?rg>
z%Ql$?6)mnNMj<n+l8Rm8u}tyr&qk{d&KmR&p<NU1+%f2D=*R9$SsS#~T5KdaI}3^#
zWFzLZo{v*AH>!wcs+r2N-4$(c5WhmrR|a5Fh<<U1;yy4al?w6#4gK&3=q1ZpyCZWR
zFd{8q03oVFXL^G%brpdNUDf<~TlKbDDQ@EGo6Rsnz)~UDGu|PRP?70`Ez?pjMqEjH
zYbedw#NM4u-%fsO7=q~b2m=KQs;CbYZa<afG1qOMEx?r?BHb4Fghd;~aSdGasi|sP
zZ%u4k7TR;*GKD26cU(iZgjV?HFR_xVY)|XW1+y^MYSqok+TFC86?N0WRn!emmf$ku
z;tQEKdeF48?fid<X#90GCor92qe0=M)k2Ile&EN4H16o!RVINbVk3_`IW|8MM;LT~
z?A~rHi5aw$iK&|QpTIn%@@)f-fcz&jk)>WOKtT+;2*sl0#_cCd+g5SoAHj*V=Od88
zz&4hJb+@^bE87~5rFkaHe9AfSkHN9DX&}NH8?X?KPDi1}C8k10wf?ECdyLq%5?$H6
znwR-Pu_v|=da>wz@gp^diB>n8t3<Oai@1+nTA<h;{qF-DO3>vYy3KuuiwhO14=Q64
zHVR_GiewpUL}4lN8pz`}Zc!8Zt4F`tVeJa{iQth4_e%U0?o*SYc-6;&Wz_KjT^t%8
zW6ys+jBgp=#>Tvdog=7+so)4DB)uw;Kz)Le^+<HDaWOudSC3NJC?&K|DjSC;Rwt3@
zE?N>bP2X%M@5KMkP>1RBbxNM3gf<Q8EG2(N$rmYklM*rj>Yr2c6-tg#a*mQPC10at
zfD-0PZJ=BaCC^$3jj82f#Xrma)OFv@K>LELz3lP`U2`+b99}rJb%)9hhp=ZZj%~59
zXW3~L;K0@0bPH8MDr=%fK~}c(#PBW7F9a_<TBg_4_19h3HnVK;nP*vz*#VX1HgvuD
z*w8I!KnUWndv4-<cbVlMdgSWP?~kzjO<!;}{zm&P0d35#$d$Xfz5D_GmNP8G`K3;D
zW0{=~T-orw$Bd7gzJ{}dZ>(JwsHVJuwJ*k`TTW4EXFcd`b)fu-=gL%v36}-D%aD(j
zHfrf>5uWC8EWYX9TS3a+#F@Fk$`F-kEPGhi%QdyzEjzmAvgbR>tTm3x{B3jI3mfJ_
zCEupyFl)UXm@f?-V+5IZ8l-Bxn!VOxkm~7GNcG?&{4K0X!+iYm;Kj)@Wv}j|b!sR_
zJVIpNH9vgON8dPYr|-eyj=iNVtOZK^Li1&f25-KSU8YyLgFD0@0R@9XWND3fq4E5o
zGRyDYbG7OF{VdODe|G0=g2;$=xOCmpzSPoM_B0C;k5hI~q>i$TBCO2KH8k1PCK*^0
z(9a*5O_qF}%Ry@SVV_56GENVPA){-U9O<59W_%oitvjXBxJuTN$xZbUl-5U8Bo(?F
z7ckIRb<>AHw=p#1{sr9vfe_|piLUV*mp*Wcr7C^6U}OAO6OCOC)azI&Zj~rWO=W_~
zM48DJ$&v2Ejl;tL3bz4w<J-6+<u*&0#M6<kAyu`K_G|Bh#%+~7>LoOR%HcE#32ry>
zyv}v~oD03rt$&Z({2tf#9=G=AT;M&f`#-qN?{hoe=RS2)+;PEUhPUon5O=@ko)u=t
n-%P)eE_u5axZS^Wt32QN3y#tcC!H@k`KGh$|CggTBkTVGqazVf

delta 1691
zcmZuxO>7%Q6rNfCt)19Oihq*WuD5kbvT^I+hDM0=hbFDUpHd{s#Z+2tcE`bB@0!_7
zX>&<IIaJU>U{pcXC^tYA5(>(t0wFF)2!Rkep)4S7l)$A@iugJ4-nxh+Vx|3d-n{v~
zdGF2JxnW&8n)oUnj}dq>e|-Ji`OKS%-i61(dYhP}N=#}>4ce5dQZrBuP_zS$U^7$=
z!8mA!8sTQ78fnT^nG%Ui5i`6<%m|Y{2%sV%)#yc8jm~E#bcZR9Yjb^;DRs+byrvth
zyoqa6$qSsEnDi3*jN@|MaK%~L`_QJ;cFCt~W3I_8*NZ>h=1<yItv+iY_1`CPZ?N?%
z6%*-`v>+DKpHW4e$}F8@GRxMaK3IWoO)|5K!D=o_qQu;1hD~{ynkm*}=HQJn*$mG|
z2&BdmtbZ3%HuH;-YThiEdqH9E#jv_xoa^<{9Uu!i1Rd6>aWotZUA!DQJC?+}?}c5~
zw7OMyH4TGxaNQ+xCqXj#%fYK1TVN6|%$YmKE%934@*yv(X+}eL98L3NO|$eSgHeRD
zRs$+`lkzyqPymG|#8iKYW`xr}OuNNOzuk3{@ZRnILUxem#8md-U;(DZa!wT=X0P?4
z23HVp+QCCp6x4e*mrw5lYYXH2h5QMjrb#sZ7tf2=bDM460dVc+y^&YbWtjK#YxDZs
zytQxgU(y39<fH*^2K)s0;QxqxQYg}6;-|t1ILCsLrXy=(%2kQ(6`$`vwr~&#p4?=v
zZtAYiN0EOR;X!o7>Q3EqT-`F57qIM?yy)o*25Y%>+fqAr?Z`)vrXctNzLc*Lck4|C
zD$SN=&pgj7s2n!tT)S2i^Ti&T5Lb#NI=yzQ_?=Wz!K;Sa+Q(4rIKl}8zo;P?K~ep(
zemqd1E#VE6g55CdAH(6n8;KGa+lv4FV4?dm@{0(00E3E^+#noTOpFg*NvTqMJ6|80
z%@_Y+D4)It#<togNOupOS(o~4=Z=2(O&yh1h){-;(XAkGUI~P#XjRhU%y5c+D%kL=
z9g0~uux>i9i;vXuPX1tNyyJb~@kbFJ6YrMK)A!bLBSW<FKN@qynFp@l?-wZ8j@Ylw
zlgRO7$F1*`CSDnlR*5)XDbqs`Z=bl4y-!@PTv*s1H!Sx;M#Fa4e9!h@%b)rJygPGG
zLhdjL<?4aYv?^`lMK@dXpPx^FZGz4Ho2KBmr5Dq*rftqO@Mr7Pv=`^zO72;ZVU^dV
zX}V?Eu8u{4zmj+1tlZ*ui*fg&7l6x);}yd(E1pAutAz0V0A8?B2mb)teg_BO67+&I
zw%y=I(I2WcY~AJ9Ec_(GB*JNgDeNULh;{YC(2vY;`4i}vMtBM#i-0Y~@p9pqr4LaU
zIFoCWqZ>4}np`z*jjg`0UYS@wIJre4p*?rfqIKkvVRLEpo$%85dZMr%Rkq@(kWTNG
zBcWtl5yhs}7=H%7V&lj_t;4W6D?^o7!)a%T^=WUqGmyXKqwQiI=QFSbFDnPn{Z4>V
cx<T@{N%2QAe4AA6hEE4*a;f+`!LPsXKiZs=SO5S3

diff --git a/ingest_pipeline/storage/__pycache__/openwebui.cpython-312.pyc b/ingest_pipeline/storage/__pycache__/openwebui.cpython-312.pyc
index 563338c0f1ec2c1a1ac78e5dfb4d3ba4df970a24..bfec7cfd6a70a89758925d5483f7247034cc052a 100644
GIT binary patch
delta 12371
zcmbVydw3hyb?02n4Bl^m009sLNP-WL6sZUGqFw|=N}?oFmZ*nK%cdv}B#{A0c>r1x
z1BQyMWU0o9Dc^NP$1geYHngoYa+KC;zO)f#x>a`D1PqlDfwi^LIQ#A9k6lDmYD-PN
z-E-~$q^x@P>$igsXU=`k+<VUNoO|w!{|otVza*9a#bnZRaJ{tqAC7(h5Xb!*6ZuP>
zW9F^rD~m@}F}{<Rh{VT)ez8;RS9hxWHJuv5L7ouP_Uk%zz>AVPrtdd&8W^vM8T(D0
zrhap$8PZxw7qj$RJFWe;P8&<>WA=VWr=#E5=_H(ri}HQd`N0?OQP(?!<BXWm>5hs}
zX(`=E-1|I|VLjxjxUHOIJj+R@s9G{#vb-ZGO*_4;#0n+0he~{`#118nsP!E_SHI|#
zD(s}skPzYN+ayHws#QIzjG?(Z9_>gB%H2n!8Oz>N$D`7=MB@17SZ{P75msevn+IdD
zXiuVdaG+zTzrR~Pl`*yq_6+qyaofO=!Hjz6uB}^J_w*>EC^Ywo-25?)qfe`fMun&-
z@%T1T<b(xIWSkoE)C+kU#%Z9Y5LFLrIPQqbgDpi#izTOYVST1x*YW7Uf#~6VZCiR{
z(LK@l@xg(3bhu(6I~aMiEqDaVf-)4gVQDa)kcWB_Lvpk(qw1A1S}Y#u?vG{!MvXm#
z0||Jmt^`a%Mu_(gM>F~!Ioh3wN?qNFjL;uVbkk7V(y9y(U1cm?UEKo%gNbgOn|N1O
zhVLDKT2gOM;w^3-CxV{VJo2O+7#WEJ{_)j7zQX-dSen)vp52-@+n#+Stv5Z}mbMqn
z3Iz&lbv(N(tv8Rw$2U)uoo^fa(u}_Nrcf-G<$Kx^CK)jSBgg3AHW#0p<lfJlWOY=N
zn>=NzwK%N{6Z-I^V-Jgy>{^)39Rq_WVo~X66oqBDmi{s38O3>hXj)}_MY#Y-#vn!G
zJ#z1HoSTe@GaZMi=}vUZg;=Z~It~doukB%-?8SCIBt=O4NQ#jJfMkSNFU&Wa#}dpe
zMKa1}BZO>ao?w&sS|B*XtCSgLlWTL%3eL2_lCqZ17%FCkirn;$ojg}JD-@>Lj9VRN
zcPVp>9ezfh4UmD?yrkl||G-_~q8xojwSiRAAE?TR`N}`5v}9EBM9q>q>Nz4v-m^ld
z_kpwz(mtsus*!Z?&)3sRe#kF^Hm0Z_SLujKDu$e5Nh6tGA(9p9YES`ky#~&zI|Hl-
zHH^ecV5}gt2ud~5XbCVSQfag_T85qFnwCY&a$G1H%5iE*b3`kZL;Z3cr{kpB+<+BP
zk5mc&2M0DqE7+rHrK+=<&Pu6T3PZc9G43Sk40mwhB^j$CCbUs(QX7r|c68A%imNuh
z0MGCuxxgjhu3YC-N$%?+$0Z2@9$th?Kw7yH@S@6<Bz;=i?RNm)vMWjGuR=~iB9~Nj
zm%5DS!vY;re_`~fQoOM#%xAQRK{C6B<XA@2eZ05p3(-><O`^9yIyjVQ4{I}GeCT*o
z&S<;3dIx$FU0t#X+A<N#Xrlwt@j*~sxdHR)kt_uQoeJ@2?1;P!5*b}rS5K@v4r(6f
zAsq~!meox7R@0wqiU+Vxd=rpQPjh$8oX&hsGovk>aNX1fKlWAMDggHNz)OMIf^gdD
zz0iKXJ?$*Ks}YLyW5P{sVOGzTl#L0$(E6GDWz=#MU}~VfCpQ7mFUR3TJq!Q&f8uD?
zSVA*e2Yp9-k^1x|UK}o=r`0YR(YxtYeTWz3W%MI`r8A>zJ=qgwN+@fgZCE9*rA>x)
zwg@ERCxQHTeB!KHL!UFW30ltTp@a6&6YHSl42diuXCqw1#7zk#Vi2Z80ePJY@}~?0
zd6O<u%}=>3k#c^jTtvQ_hf)RsJ)kNJmkv1g@K$PYtZb1~Niej%oFqu%E5app-bOtO
zIbVeN{ZrKi{;Q(Mji{2U(}qPEku-V9IYX$mD@ea#auY56GgG}`L5?IHy=^MfcYc>Y
zLBjgs&}RCy)maei9SEYF2AR>Q%LtF|>ex%0EL+V8S8^2+w9WK2OX2$AmHP&wCy#^G
zi%P-v!2!jHFt9r!5B3MYkcYz{N?nlI2*5c8fAoizrQKl-lcS7Ajy^pU1@OYjm$w1Q
z@JFMGjJ`MCI}lHF5A;Nt5Qaq=VM~EdZ5~-s4&p<xM8>!<U{|jc$2X-e+vd?nfQh4;
zu|>S?@y~g}GoJ9AXW5KrS=wk%8!K)X7NrB*(uLl1X~pk!qTQU;aNgzfoX)HNgwr|o
zW7@2fGdfcS-z|G_DzJanejsH$khXa)_|N-kU`(BM`!5WiAHEoxbytoVe`WE#**F>d
z(dL_FO}DmTi(Rw!M^nZ}KepJ%*UwslDQz%Y4*lMbTj9CRR5q*0TclYK-j4Wy{d{>Y
zLXi+8)jKM>tk7*BNpf0sl<NSPpiehA>A1sST7(8wLQ5wdfvupcBf<laAtace2ZM6&
z<ODBHo^vKp&)JnQ=eeYiuQ4LhFNa;lNii=~gnMq4z$N((ZZ-GZQ6@nG9dj-hGyK-p
zz4V7p?_r&S5N*&KTTpoia<xcGkl^Yti<D7!9|wVx!fIu0cVYpGSVliEDED{Az`u|(
zLT@74pV55ba2GOhbV+Gj!OqbhVB+5Z@_B1}xjeOY_pE2noMX?JHf?ag@}(UGV{K`R
z`}vV`BVQXG6K+{N6QMVSo0f8=WW~xcJz&lqPSDkiwd6{FVJZLETYNLH@^WI<yMA1g
zwtDBRB{SBNiz_RCVXe;UpfX^S)tl0KvL4RaLGH(0@Jwfd%|`Mq(ySN09U;I@l~(|j
zH(p7&dR1GPLZK%Bh8=NHMqE_PIa31!S9v><14!8X?E)^WUsM8lBQ5i+C++l*r%>Gl
zg~O%v^o}48;(z50&oWYjeP*;$&JkrpEC3FoCXU1aXIgdTkKS#>DjAa^c=9H&tSWS(
z>4pZkpiZh!(`->8eai2rZxwm`w!9>aXp>smns7rm>`H1Ah4iB$Ke5w47Oiv`BuA2e
znUkEa@=`%k+e<FF=<Xt~D&e7{evc^t;&TrE&N43HrJIU9#7&<st|W!@z2aBM2D&$}
z$9Dw!%?Rij-Pb3gClmF@W8J+2aw}xh9|cx6%3-XaKHe>N_s56B|8GQMp6<}`*kHFL
zJE$tSk8Gu}V6ez6H$g89ellA0UzrQWCf`9PgMmHF+&v`B%=1DEkzbKR*aut1cI2E$
z@abff>5L8s?_wQ44Qcw6$3yp(1RUof5q}XDL$NWgD&02v!}=BUhb7VGIscLw|B^ZX
z${GL4wAGci2GcHIx~%eA`HXv8R>u{un&-q~^Cz5GXdc^^HFDO%lqGP>RhlYmpLOj@
zS$EO>rK=u$xEp)u;=zmUm%}OR`m`%>(VZ#?1K?q20(K@~XLpU9(>;EIu1^^Q**3x#
zneSzbV3<#{K`6g>*NR5)U|Fd9DR}-fq%}y+x?oYhNm|wlFE_h^y}q2ZtQW4Yh^&Id
zbeObk6sD`q$gjcb(`yOx>lxjM^aD=U>gPYuSy~JE4+=%({d{YXilI`~3#u#OP=|_G
z=}1L``2=^8f1Eo(81$Iv^OciJH^5`G%ZGtxc#wA)ZS!Y<6h)oFpE;*5s;Jq~NZ+V>
zo@nT@aCM!eO{yfFq?ZgJ_s0C@5ezN&8AHn_`O}378`V{p8ediAwE(Q_8{yT&On(`!
zH`rhdc1afc(IYN9h`;q!ezEE~Hegt?ol`@R9W=v{6hSkb4_NmH2c?&)i$>o7EwQn;
zEohe!^kfN16bWjGj82|>3<*pmC-(x`yG8Cpz8}c&>VLOl1dj~L!8~FFnXw+Gx|+44
zgV@<|Bq+b~Rv=-cEF-UI3UYBI=*!AONEY>mVcIs#V@QU|6V}SZn6aQJ8H=KuU3t?k
zKZE6LxOV1>qWO=rmHbW3<LVDFwVSro9@{flwPvPj&0JN}OjQ&3j%jBo?G2<WYpz9S
zd^<r?!Vv<h61Ib?l-b8EpeoL?l%x8Vw;~ljl<Jn|x{uCuA59%Pma6QX_4cKlee~D0
zZKH1AoU3BSRWawPn{m})$F8c$qDk}R-juT`?Jc`_Amv#Cy5p_~-El+jg3X>q0_s!f
zn^;YgDQj7_9>)AMTMF6t<K^(o&o*mXmXhmw(o!p2H#FNIF<nGj>V#>(75O>>G-H#a
z4)kxkqIu^uKCEgC()X7%)ws8G1DZ&|#2{?f2jwVuSc#rvjlr;O5y@m7PF^v6y)M|!
z<{Ys~?m&WOM=`-x;4+#M-SR;1z|loJlo9&C*AJT%Q-dC`0&FA54bzJHdIP#uax)Sz
zKlQElzXdkF7jW#J0%YDz^lJSoXR#@C>9H&aw;z@L3*NF#gp#E<Tqh7y{`F2f;R>2b
z+O_@O-D-rC1It2MG<au8tA;+ithS<6L#F+trIMQts*zUeS_OW3sikETKfOr={sV!B
zs`r+K>{ZZi2ke$EfK!xI9Z`+&S1Oke5Rag|#-HHBGK)yM;sPXs^z9W(wnNN`iw7a8
zJa-XiDx3(Uj8$Xgu9mZurb_qEnh&J32kx;pXRLPe854@W2s5Dv3H_sYGkvU~-Y$vE
z?5RPyHAw=>tp&4Js3IJlYN{~-%p}Rn+^Z_daLI@TA;O(9fQCN_|E2KPfjz`-*%gAF
zJos>0YI7H9B@?`vaLG)c*jz*PtKVx?V2|lM>gTYr9?eX>9PJ-`Cc3Do8FfqR&epxH
z3NXAyGP>?qZ16-^!_tP~@>Y6kP3RD0YC+Oq=XYcfoUtb8?E&>=vcrT$jLPz$oOi_+
z=2S+Tm*JrY=6MJ4l5y*oQA^QSG!dn{)_QDJIM@FSxjAF!rl-~}8Fjel?4>jI(m8we
zjJ+BSUCu()rmUOLLith!sAY~C&@u;FD3ckq42Y3?xNTwD9=zzgXi8b@(%$0FZKUU%
zh1p7wzE87O=;YJUtPyVaKxM6-JDf`Axn;CJzw_MAl&9%hP3o~H#&+H`9=zo!{MW1q
zg@1_0;Q7yx=320Lk&R&SB5Q<~)xf=hdEcr8Zc0ZYjlz_^3i;(EvR;^4At1jRt4ysS
z$Tu>&o<vqdVxz7(%wN|OHi!7@0TC))4~du)=7Il=9YY*s@}|FXX&oVSWP=Izc3<0&
z2(pNhesL4T)I6gZ8o;ap`Egpmv0{m+xRcCzVX)0s79lm9Q<Eowm(i-r&GhAsTWmXV
z&0d7GvSwyIy|b~Gc<4_zg|z4r!Bp_{{-)w^Gf$?9NTiILDi)EJ>6$rys@4)&$4{*j
zfxpi2P^U*lyR}Z(vVyvl&{vvvLpUg@0$Zp7brBR*DJ7`FT;GBgz&N?<8BR7~34K@V
z5XlBk(G2>>h<Wss0Ls$?|23dM#(V=%pg$ks6PA2B$xHhD)<!;^Sg_ZaFY$RRJR&58
zFF*Z2D?u_Ww2CGWLD|)Z)=RnQA6Dub7st(;{FQ)6NudvS1P@&!A~@T|F92-GA>}m=
zqk`v$AsBSx@wb@sIOL4*U*b;*|F&$vSjH{m;^YJX&EqgA;RblcPfFnWva8QSBb(hz
zc<}9cB?s%~`h;Ku_I-kU#=o-CuWX(zW<ax79*0IULmExJqSx|y$fB{9YA17Z4X|HN
z48^;82Bm24e<XCGWwpA#6(NIWTYPk=)iNqmXaTmR3Hw^~5SC(+L5zSHB%@$vG{?H*
z-3bUIYak%N7(I(WpG?Gh4`;LxuR0FSLR@|o8>5is_mPW!INGR;DeqErb(^6(R-bJn
zgVehvV(UT~M?qI)+*wLvTSBWo2U`@+xiV#K{J)`#nf`c7J%nA04v<fCz~W`VVg_Kb
zxW=EJsD|z4tzhLOnQVj|WpMqtDeVZR9JN1iU-jQG-CVZ+mZxmaQ#<3Sz4Z93XZ7zm
zp`a>Vv0|=b(@e#t2}9afF<JI=-;!HJrLXUJX-BH+VCt#<n?(b#FZe_URqsOmVAXBk
zl21fP0azAPu`cf4)pI5X0$bV|q35@{Mzel+ra#0-VS>(puMT+DtU^572zUnE8<_X4
za^R*kq?r?@v@4O{fZ0<U3GmlBMpe3&wfuEMgllQw-#3I?4C4C@TIAP@P<0xL8~AC1
z*y7YpTLZ|~vwTy72<@iV@=!^B>dO0V#l+1#69#0OeF|>111@c+pKjmmW<FyMq!>PR
z;i4DNJv$yF&tG|GM-^GZwp%I`189V$3t@*052qMmUhxE2>+lPYw2+r*>mzG}Wmpw^
z>p{05f1&@xkhY1w_DFxFBq&xpuZ*xc5ZUH{&qd(?F-|W@(0^(u_T>N#8%Ww$9|)Wz
zIr^^8X-zI{2q1tX^qC-z>s2Eh^jT=hN~ibeLU?9G{QyF#6L$J)ySp4Gh+Ro_9%TlI
zq#x0s=dE0QZn~_<(fHtl7?K)z9OJ7C(Lul^4U6Ht2zZGH4(tNFTsxv=?_n}2z|7vm
zOn2{c(C_;k^u#WUUmVeXN!tNafcJ+G!$QBkE3tkz^v0l~{l0a_XG4LN_cfKls<xKK
z;C(|l2!}(k=@=T2l-)8eAB{X3*~hRzl%j`+jy?brXRzDvAlZiGv#Tt>gL$tZLHK~s
z3JVx2f`YkE(YZ%UO(-TAu?NOXfRQurb5ZZ^)wb6V1nL$*Kyc8*yGuLgLJc#ahPlxC
znb7*QwE$g{eHXW;thMtZUk<(qA25&Y%0f&ykg`<Vvbrvq&zn;v%Pxm5yDp!&I&}5u
zwI@=6-8Zd!(y*CuubFYLxoV$vuZO)ieS7yIjSt%2yIV}{ds_B)z+-_T7L&6ZHhZ`!
zLN>dFDb;f18!&rnWuycW@4GPZzMCNL(Y5&a_e<+qT>P|^06%RLp>*0MBJbl{is{8Y
zZnBeJTDQ)86hp<Ng?sV|hzs&`>2^15>?o!(#18}8jr3%P(Y+W$T#(wNkkHYWJA7>I
zf6`$pdlG_wDkeC`z}Rko$k;kTcr5f@$Dv9TQ~A$;;O-Qz+nYcES>_KQmC@kYVORfQ
zn%rC2qgDKpx1c~-Q`B}i5`$PxLfN$7f-2$p+^V9Zk}>ow9K6OAuLb*7M)^yupouHz
zv239`R{jMp@&{0$Aidzw?IGz<)m&)POlZ?=C^A<Z8QYbHIN*-kuJSva-c&oTO4D!e
z+h0%se72Bt!rq`b8{h)XfbUvr-d{i32Hk-d6e4FG%>s7;v2r2++<SnI>Z=hAuv43`
z9Pv`%uB#Xobj>CFb(5vJh`(MWB45HoodstP9+bn?U=VZ_v?9N?iPz{j@PM$KUG!&r
z%IL55zeax>aT?%=I4R)f0^-C!Tjv%5Q%*0TKU*2_!%hUz2umg1XECYIf!>tqK~NHD
zm%oVKIpFEgKLAFW2SR<CMaalQqHIX`@=ujqfEj=$9%N!6vfSqfXeu~>Ph(7Kfto(^
zG=M4~Rrf)v7Qh%FiAO)>6rcA@pvFh=|Mo+*%13ngt{O9YS0l|nR!=Nff{(vO3Yl0S
zwzPu~GP4kb1niIhvGaf`LumaI9RX&27H~`cE>`$+B;P|4reA-egj}ZId!l;OBL5Jw
z;DmdqUvX3lz(46)^t}(C>cZ1<MU)qP9E3FaAp~16Q3`my3sv$F#Z6fKDw0Ke_kB#7
zuOLMjlkvSEnCK-xpvi+i_1~j>57So<ZX!kWzaCt1@c$RT>Ql>_uT|bCzu`_j3J7-a
zruE6sL$E6P)RRk85kjAPvP7N3vL8ITY!nsw4BzS{Uv;#&xR*$aQ}|{9aNi@4_pY-g
z%uR`;rCgX&tC2Ti_LRwie30=arNCe3VdpPg7nUQx3iGe8jub&++JT8_CxI@fUAmT1
zembDSoDzb3=@uM%x}0FuN=C!FRyRMr+}CR7KQM_<`hi`9oDbYsb74mhPrZ1A_**#V
zdTI@k=*1?#aGIRrY4)k&L$H@v0Ld|O1U`E?t4;DP9GV`y7Tt9w$h9D%3+^`vvJ*D*
z2Bjv{6?4j(Q|6>_MnwlV7Z5dlv+KR3OceJ(<$rs|xdL+MzY63<lEVe=$u;z=hsyX0
zb|O?T%H>^yb1JsQurEIL;sY)2HvW`cAaJnLC~&8gxT=bQXglomnS_?WSc*7{$W;OX
zMfz*xnQ$VmFC6;9#-HcpAJZ4RH>$0mbn!;|%kJu;yCPTMx#_9DY@c&B{Eml!*gY04
zcy=QQQ1jvHo$3b+J(_p;<^*E?Ov4oDf8YdA#{GtjMu3H(l(560eAq#rqJMq3rtyEH
zI(!Z4e46v@ExNrV?Js#SBz`%X+OTidzkklXe{35Z4nYVVB%KC&YP1Hf@Bq1Y*Gu>G
zRJArkH_wvD3i6de#KFBuA~xYaseyY3^Dc#eo3bK1Wh2Ntbdja}RFNf8!%x+S$S>t1
zE9hVJd|A60dU}h%A@fFQHSyACq&_G5F?oPbs*?N>eng;w2G<MG_F(R%Z$K6KCrJJ?
zlCJ|%UYZ_@E?pnMX+}pjw@v3v1>;92o=F+Y$4J_2f4=Wr-`8SuTJO)b-urRf9G~%&
zk(Wt{@QS*O-iZ43h|kQ{{OHR6idqS5vblrM=ZJ1Z5B9w7=x+BDk|n8!{kJ-)mn`_X
z!-#QUH~0p1M*})*UfSsHatFUWsi(Gxvrt;d9x)|!(1Kk_6RTu{J5-|o^Qg~fStv8+
zI~p;9M{EA~bmYi&lssk<%>#C&35Ar&{J@}Q`lDm3mzX8TFsNUCki6w$?z1InNE#)z
z<V+gTg0i;`(0#o{yd}re-VLe|E4B8z*Dbsm;l{~xqu>%T!v*{dXgq$Z!!FSHEh9FF
zEU04U5xa^@+WU&pGv_@?8x8h_4U2DXqkH?x4Yn`Yz^zt|!2QbEz5^;XL-}vgU&UPH
zar$X&9XUoD`Zp=Ist3l%=;MP!au55gLph<xPy>CrKfD6%netgtml9=X&KItnj7N4d
z;?V!V7|XDF3xo|DgR+a>>o3u;uaD$k(5ityIkF5ZGD9?l+(Z8MmoX1rHRV`0h}?TX
zGJJpc$wj{{qlpb3J&GabGf)_IC~o;rvG&i9Y@&sOemA~p#&WzHDzdMhFq9dWPtu)(
z-mnv^Ek5~8tcnMlEMBR^q1kbOgPtCA(iaBT*utm~e+5KQh}vHI;oxiDCG}%%w}Rox
z`q^OPJXde3Id2>%<7+?m6wz-TKTz%qy}se44U?`}-_r4xTkevJp-aL|_Y&A!e`n1b
zYbLkMmaUl3Qq$AHinKd;VdVVC#r?DH+Hv8Q!#^Rt*>cknPWu9{uX$<B#VwPOSzjI9
z_w?G)teW$cr2XaT(onj*W^&tPW2$V`tx)Bp?t7-UOqU0)#b&EIW<z_^;nr)%u63p=
zA5E9m-YN;D3rk)%y=1x=n=M@N^TK_XPrWzt?g(rr_UxTqy>FgZmAZasGgRBhwcwW8
z;7mF=V+~#`{6{#F?jrDJ*~5f$`cp<jQMOCP6>lZ??;fUhIXPNH&Mx1k=l+sx(+KZr
zfcqQLRz!Zh6u7B+WT%#HaY5pS8WT4(1bMx#&BNbttZQ@fKQR;Fe_|1#^e0Xcc@Gc#
zg6j&4!=dxW;A8+81=$h+#&A(n+)BzI6kh#8)ZkY=c)$jMaMdXlICg4w*u~S|#(ksc
zKB3e0I@}fe@b}35Es!|&sKl9N%p6|)7%%s+W?fHgFdlsyWdQ?BOcp*i*vA_t{5K7i
zX}c>QdajzWSIye1=Zw`e#_BB38LQI9YDCIWfXeEX<PupSd{?uQz{f%BpriKOU9N)!
z@V|tc45M)2>d*a755u<XJ3U2Fn9AreZ#5FsL3uNhT}Wz?poPUv(I{BK!-In{xd}56
zMCB7m&LQ~*k_$*)M)D?-Ad<I`d<V%S5;GEXS((2mGgbaONM;1~8K<ckzR+pSpEG6D
zgNOUzvmW^$u)!!Il>BQXIK>%L?i;V3Xe`#%6(({c<g$fmVgY|PBaGBwK?)}2Q~c6!
z!);q|R)7<1@5G9W{KT5`1G7RXE11QyiILxPaLWccwfT-pC+;HiJg`~DW-DAyv1GC%
z%fan($2{J$wPw*fDWz7l&D3q5hqm5qkbeBkveD(@Hga)Wmc#qCvKzuwwZcOb{|?K{
zb&TcNV+01dy}kVozk`UaB<=A}9DAuan@eqIy4LVlow?L)ooTG+oac_nYUVm&e6~}C
zy+m5?@HTPuF_QK{4>l2)hSgU??`~HTw{^DhmUDqSB9`QuBb%*&#_9GwceoPKGs$Q1
zcFl1uG38}!>Hs`8WaU}_m)$~aVmp}>COh8J&2z|SD{4j0<#?8>6-PZ+6Z3HQWDgOo
zxR0ck!(1S91Lh6yStl><A*uS-EQidEvUzsT>I=lRS65^?xLxaEx74nva_{S($Lwrf
z0W_FwfnC8&?Pko{L$Y<;`X+LRTP7Av_FQgxt8X-m{52?sTlNU?h<nLpcq_c8*0iT~
z@0(e(Z=NORSMj1VtJjLY+jiIZ$c(*wQkb#VW<|&WytD@{I%jO<Sq&z&oXtJqJa5YC
zFs0}8=6M5hg`CTicDb{fQ6iclzjCzZjsf}G7JF7?nQG4FTqyVYClW7tv#bgn9l^K5
zu^F9j-h?$jX%={~MlM4!XDaPizOM!C=j1n#pn1utL0!;{@tA`U$Bt1mHYIx$&T8S?
z=s14q%yc?q>4DSPIye<mJ}-<b-<Uwq0&@EyL>`MP8jVl@Y7SZ`8?je}3;1{$KCzA~
zx{FGf(ZMEjCm2#Vf<p&GiI%H#IRTDyE1ys+(1CBEd<0xZyN4Ys??4*iGA;wj@`R8K
zS2C~Wh~-1h_918fhzrkf;ooo-zu~Gs;+B2H)qTV*rymZNF42;}MBC)P-*dp+b!mxn
Z;_=BSrkr=Z&3aNZ{>9&OcxSWse*m41)~x^l

delta 15320
zcmc(GX>=RMnP3;X8}|(mBzS@(cvHM}kUGIz7iCG*MM<V80<uW)kQ<O?(V*bS%B++)
zV<{C|l8;z+{3dkl#PljNp=Wk%lA>(-Z88Iz$`XSpFUlr6JK6X01`$1prDS&Z`>Fww
zl4VbR?0egM{Q9e}s=u!8{_ZOL^FNUbzb6I%)nL$aaJ;Mj$<foj9QP}1Bn~l-%x}6_
zkQw6p_<o^7=odT0er1QUU)7-^oR@eNed-Q1oP|D3zqUh5IG-RHpe^>P`*j_<etn0&
z-_T*`H+C2aH&EeI_c{_cSUh*=fS$70PGB8+pr>Lhlpx9H4g++g-%rC<htaF_s`^a*
z<_<GVPw7?nS^BLV)_z-u4cZ#7w$I+5)R9Cu1?N-rmVTatFZnGZQ#(?8B8;hGt&2ak
zW~X{}YoMXvS~#!%Eax@&lHTIuW7AG4ii~s(ahrvxp?%*YO`Q#`O%0njwzbeM;$BlE
zM0Fnjse$f>z8>E|AgXT|92oF*2bv^lP>Pyb+uI-68R!a}@XG}K4&UP^e15r`ewD0P
zMxwg<F28SQU{LCM%okN|+1Aq1w4+<Ty9^ES#{4)P6`M&Z{ezgRQ~Fds;}L}u`mUuZ
z)g;7b?}XW>`kV{1PxYqxmW=c&eQ8GoZ~9rGBmJR08PJpA&Gf0f8u<VGwQ6q`jK~B&
zhNXOA79sA4!s~+0EU(IIe3^L7z(6&m;^1Skn`WO?cDNW@<<d*#F)*ndxHj9n%$p16
z9IxA#>vQA7#d+lU+;J@5XN+SY5J%MB0vMmC;WlYFZ(01-g}yXz5&SQm!h`eW;L_r=
zs*Zebska1J6rAIpBpro2xuSCFRJRf(eN4Tg^nIAY^W+j2h<^f(JI@EXZ-52`NkW_m
z*TW4ff`lH=wJRm7moPNN5ma~;C{_V@2l5fna2)+tbvpg6S|cjF{M!OGX>xh7NJ*D#
zj-?E#>U~|3PjW>Ko)dwigHq2>SD<HbfL_%ktB(4*ygtcK-`8YpjjFni_jDffos!hR
zILiA2QdI35@E#xR83;&8K$B1xK{f@yukVPIjFdDSs_E?P?(6dVJ3IXXv|TRO)3k%%
zs?3DOkdwZ<*B0s-=m~UoW&^>00KjKYbDtVHjq$u{MxAomaZ~NOo#Q^Iis&rQt^3-#
zNKwV8<42kAW`-*^gbO_9S}tsx(Yt@`$i9^XgI~?Mk~N!D6tSm8>?xnBgk<eG;aOcw
z%Vp=D6Mm}Bm<Rq`R4MraC!~S4Zl<2}Rjo>gZ|oWPpZ@`&?`m(R2beL#(QZyE87BB5
z<-;p})0v!MOf(nIFM-?z$xGZT0)1R(R|L#-yUs~e^q4MH5wNm`8X5(>W+<C(&^YK@
zy5#<QuDJTbTXzKpUE7ZP2KM+4@7m}(($&-F^VYfUITva2ynSAm50%|@PXXN-aRq<)
z)kE3Mj1TtqP>;s0taBA<rDXaWT|u3M4<(_pOZd1^wdC_39~|)eqB=h_A)VcWAObq<
z(=<KV?K_UbQKXP^s9V3<vK;9C{{`S*@SDYyMtWSoF{I_p>32AyX(P9+nc-~Dc=ot0
zoYgdIZJzdo^;`dV%an=TU2=EbSmg(G@72w%-afN>d$?{#ct?A9*Y0rpo^aOQS?j)V
z=b^Cv5L}an*KC%rSvU6hSa&$9e%9JBZ3*i)L3avvZ^Lf-p*}6t36nZQ8j{Fa59cv(
z69Vz*gb7hVT%!Q`gpMF?&@@>235Us($4}(x5wFazPv$3+5ueO8)mQP8RSaKeYB2EE
z4I<F5TY2CR6$ZNceccMUQ{q6?U^1l0SAY;@(*uSia}fMm59j5*!pp+j;#&$@vBIGk
zR?uHmIcSANEf6jUgZJ5?p`kYoDPRVEYbYls`kKK`D~-;52XncAIdKaRM*FZBFeTbv
zbx;I}QzR@yP&@-#J}jOVPm+K&F^Y-s(yKH<vDZ$C&K7!z2L(CSGOofyxi0wD&&@^m
zC39h(7w2>TRp2$f`Y*ohB=;o0k2^`e&z~ek2D;stPlt^y)hKvTo!95@mU@^-Mg?zI
zpet(Z>hAV|sp%dBqcqs}CVZq`|KLDW(c`80ri#!|#g{9a%X>oV8F<XqE%}%ktaC{v
zaH}Ef=R1a$eTmvVWH_o}2=p2Ckg@l<jtvZ+1j=JR*I{tSpq55vNTb5>L4P1>mb!ZU
zzRn|qQm3qo(rSEa{xM%5s_pUj3;=bY8%#G)Wff-1jCw3pAgDxusw-jGQKXb|%CLd&
zjtxL7=s(d10mQ;YI(xiQHT3(H09^D(riM@}HY>nR$~rEjgO)`yvR~bQW&d2pvYCu!
z5p(hFbXO#IOC&url3)Bgjp(q(L@u*zo>ONU|G=qJjOSWoR?d(#r_Y<w=iSs7M3OQt
z9lUsucAjgFq-DQacct#CcQ&o$+?HS3vfdaPEuG?T7Bt>+<b-o~hGre@VRQShZH^1U
zS(`hocgM1U<K0i)aVztvY!bGIckB#rZx3hfnzil@A2=A+ACwIZuSo)<5V4kwc;4Cc
z=BByQ`kB)Da7jbBVOMzfp75@{Ve`IuUSTudw%KE%!jSaGPnB`j`+;=|Sg^L~$EU&E
z?3lIg4Dag*>pRfi(7)HaLkHpIoFR=CayGAC!@WuBRl@f?>3~iukvgd&h-);BMt;(2
zs?X*pv-OBC%Wtsp*KLSj&oVWX@z={3UT135@KYKQ=u<`>ILHnP?t%w?T4r9JgwL^=
zBOIMJm(fRa)%IsNui`15<6cl);{QSvxnT?lep!V!g&7!dY0SXr3=3W?s0e6jt0had
zo#TdufQJ6NAtQ@CYYz&;Vvz4$Ffi=S3<O0wYGEuxjofp}=TzN%57(_YXyLd6U<HSj
z!>WKSF+8YTupKI@c-AIx-Tbg>c!5f|XLkx*kl)Fz<et6ItswFKlN?iZeyCyxbJ4EA
zQJ<@?#~*MF9$8Qr`hP4*p?i*U2uaGHs4QO)-*Oz-2HuUuBkN%<(mDjFIMN0HQ2|GQ
zvFPazM3r5~!Pk1DVo$)=?`L{cq?U4UEYqJ=c!73cQ0njM>lyNSqXG_$Y7lmM&B%fr
zi;^e&X!cz$`n+{Z=qRB6?*d@ja@(2lYTA`Fj7h>po>^!8oUQ(xI-)kusk3L)**Dd>
z5mWMW!{>*;9y%x7GC421-w<w^@*=jRa~mUN73Z`N!`$I`%~o=*G2Z=C=q|6mpoy4M
z=giqN=Ik-&2U+iB&DL(3%h~+yA^WIh)bmF5)yKcHVx;o5+S#1VKQ(WOsgOlX&6!if
zYG*8ovp0}?^Hwf*3%Tnrgvp-Cs;?ujk@_m(b&mnii3%6MNwcHAMn9R4l*t+;K&j~3
z^R^yEGczF=XBKJXK#v&~7Z7Aagg!-LuYVh28xS-AfG@*dFT1{oHagajdioVd3Mr>A
zIts`W*Crj6qy(8o)!xDG6aA3hNZ4HPvKX%|L~4J-Q&QG&tt&+&;6flz)O!stE8aHJ
zvK1-HVP#O+n?#>>r=o{d(g~03VLx)FWSA1NIjjz<C366Ses%=afmHe@X9j)6si%3V
z#WqWj2XAP7h4<Qm>K^j8UH0Gia}T7^)2Ysa3XtTN;NK1YIz7RWc{@!2bW=XON%Z~H
zR966_Uv@CpymWvgsOfc~Yu<|Q>VX3$lN{7wh?#hVpoTeo&1nrde0O5_=Wd&Vw@nY^
zf8hWp3@9L}^q*5-CWZ8wv>lE|VQf@50zv3KZNT?rp!|4WSI+>Ar7gEaMI`&9%Hv&9
z7wFC!+L^v9sSYlXiV>jGlrSNdmeIdXcct5<a%^Cr8CCcD0$u2>WeHhBf0v#WVhXz!
z$K0>5vUmG(#}*f=y?8Yf#CmocoFPVN(h=-HjgD%N*2(VOi$vz?(5lk&4ikMUBg^tF
zX!sS1gtv2)(6=&PT)EWQxgw6VNN&M+-b`|9OvT)sfNoA;Zce+@&C&mqxgxaWTC4l&
zfvat!MPc)r@r~0b!wq|4JY%3h1`5VNxs(BVy_0lJSf3SZAbh&<ZY&*c^I0q%#@>Y#
z>CcF>xBov6v}sb7J9Gx#(;3p@BxfB>7VbsTq!nJOM|851G#P}+D$gotOcj$RlQ311
z3HS{S4!@x#h#MF*F=)}WIQSc>rlunPMv)%z<@wEN{D*0Xe^_8@UcrC30`ZR&rWOnT
zkwt8ADEW^Ze2bI5n3bbA%wKyyYo~(bP-{+&>pm4I8P+Y)JVQ{|o6i&rZQcV1D3&p(
zyHBxnOtEyQb)Z-%)$Cx3wUn!gmgb~Vb50sD16DvRv^{5}0`Jf!bpVX=V96xZyZd}O
z8Ziq0^L-#}&nxJ9Llt=POT4;Qk5i;NcajmZc{P@qz^3Wm;%S9DHQ|8Kr1A6-r)<(*
za;FeI{h_;@IBA<Z$Lck{!Y9nb8FGG+rQK#auYxBvgFUkZMX+a9v}f*Q9*kvzH|@<!
zTl-gF$Fi9xwzWz7VV=?f1Q_o~Xcr_*u%tr>x&X8{ONSBnAz1Ux{I$#xN<G+QnueyK
z$RHg<0&@)LJ)}Ma{RjpSe7O-o;{pB#%OcVs0@UlM>BRBA!7guSB5{?DV^=R4!l<b$
z5a{YYy4Y8beK`R9Xi;4B<NSTfUt+V478V>``Ht>Q-CW_SnZi{OyE~Ga6)7kg_syh%
z|Ky5l=Q*Ls3TmEfy<mcJg2gpwu9z`b+%#9w|6Z^$RJ3f#)sDiE^bzA|PuRX;S`*&c
z5pLNJnvOga$V0(+D3|j1b#m(El{6SO=f;ZQ7N5m3VbDE)9!&0;dSzn`nbeTR3Sm;q
z8dGM{SS3tZT+lI9MF6HmEplm~)0fE7{mcN<zc1VnTK4B<J%_sj-A5BCk13JE#HmBY
ze@4EO7@NFUbMOZSsjf(8bu797$q0`nxoBaLE3^So%ul3N1WYWHh+*y;Rh{gT1|T6@
zj4~jhgNl<}w?NDNK&k^WhTm6`5HM%(Bw{EuQ8CcvKjx3B<gCXZRf9L6KPXDpd2k5&
z0;!&ci<**t45<Id5Nh0&bDq>jqG_VvNwX$JS(dt)4&{!8xf@f540j~7pe9!K;1
z$2+ZrOR6Uk$ELfV7B5L6z95HyGRPNYC*$kGJKMuMc7@HmzaTl;E9X6%r#;ivVN=$&
zS?eR1&*=BC<YZfkTm2L~##z!_PM<0%-PBx8rZPxl0XOARA}r7}m-15;rpERB)OtPO
zH+1<;mHdrLhOad>>-i7$h<})3YAygfEFxaY1G}G;xV0|ejTy)#?iyb@K$3X*wSN`J
z?6vzb;GthzwrpJ%yhpzsTI^kZn!}lL!a2KVjeElCJ$G3}@QmI_9v<Mu6cFG^Ru+Sa
zV6&jQ1~yA2$6&&+5ESBhjhenv=A^0hc8!`9;Gi6WWfmo*GGecmzP7=p(HsMtERj=M
z`p!O9cqt{^DJ__}^YDKV{)-@N)5AR30cJjDSQ$V;Wd|C^bzWVN1eI^=6Qyp#?Ss0`
zu=2F>6p_yl)Lfb#WRdALKvarv<AFnRAe~wMlP=qa0RrAgz8BU^;dto17HT&SpRVc8
znC{YI&gY)E$_v%2|LBSDE74eJSNT{-_I^iU+C%zsjJe7sU;p3}zC~ZayvA?71+vjT
zRK92|pzP9pbV&*H<Wb*%%j@g&1+XfEoLqT+sOqS}%60Y(92p#1^^n?Vtz0jO*GTjH
zu7|RTs!j}G<~Xoe$??%gE8L->>|F!CCy&F5%0iv>!6|^5VFB&^9xJM3<9u@Eg$1q5
ziixaP%POq0xmqmBs2<Q8sh)%6NRC!bGPecy73JZn{TMhv4IK{&y`1!y_?naH@w#M7
z73$jK0A#!6$fx?sWueTR&&QypVe|U&Q{f#4!_ANW2SMm<cj0$8zqWbKy<*0_Vk~o7
zH$EI*xog(FdoFYLxor_s=A5Z`##B7g{fVhElAIRNr_Je0XY{2v^<@!Tax6ClmhrQg
z8A8_2z;9;lA$LF3GutR=oVWDW=eC^R5;1$mSBLi<fSDMapK=O=5o$1Yr(D2MEg7~c
zQd<7bmhWx3z+ci|)X$j<KQR}M^+e2R5odZ#!!8!#V!eDZl#CS`XDEJ?u(Nf#Bz&m*
z+?Jbq?=4#j+DSHGp?}TTF{nFZ|6c5eYLLeHC;t!N{hlFBD<IUZFNRRJ-YvYO1nf1W
zy`B%)gqqan3lo~<h_55{g~G&o8{m^x91@zenX!?JjY&5_JfFcr28%UK)%;|2N`sld
zt`lL*b+aBQ*V9)wrt?$DNSR7U%2Z)WlgQuTka9yr$_-0OQyE0fj8Y~drJ9G{`yx#(
z22Rhw|9teDW!W^m(Md<DK5{*<zQHe9-%vyShee^)3-%8#j~@^|YS17r$v}Asl*urE
z8fvt#=CQiknW1GP7K_qLM_6$L(a~Mi1rW6kR|hIU;-S#8P{rw#qkwM!Rf6KwLsCjh
zO@6ahVzmVq4qy=_(>Hw9C5l#w%|&e!WNq7p)ZGZGskf%t;zPB873jFy7|rzWYI;Kd
zpVlxEt0uH^d5XFpCJD<JC3O4p%<hH~GLcR^x!gpih%i^vP{>b|nmnudiPd_*Csq0N
z%b>W(@LE%Yn!m0_{JP!Lkjr1s6%jAwfzN`w1^$cm6eZSEvgtoA->wZR;5#cZjX*yt
z4D*m~$R$Lz8gdU3<a*V#ZH3dRMh^EML9&*E+T!U=8Ov0#WT}vQ!P^SpWsk#uD|p%k
z$pY7P3_W?T8NDB|GH0!3&N@xzLSI>7a4=6RoEA<Ai-HT~9q{a;HgWNGw6+f%FjWDv
zr~ADq@<ERcXAs%@z3Auouh++U#A`TlPkcX*``zg0c+iS+Wi8}z^5h=MVd?rv4iscD
zxMhd@lq!q|;7RDp@)BCU>JvNjvF#FbvZ`{~RnV;3V#U`uda!n7_UeZ?MtRXN?hxsV
zwP|_M*Wn&RwO{Umainf&Wg`Cf(HCmVj6)?$y(EybdSLxx(JP``l8ZU48ps@>fG+z%
z^?VKoGUZ)VR8dycGVEeW8!O1Nat*A5b98&1$8s9Awr4?W?aSzQ>fGfCXIDOxQ68>p
z96vDL7T&QhT+uO`v41Xk|GCzP-oCI75mVBCuPYB_aOr!<XE8mOasZr@oik_M;dC13
zZIk)Aq4Ps?ro0(b-iYlJQ|T?U<C5;8E}Z^Ict_Vw^Wj^`X$u}~Ys751q`jz}Gw08k
z^CRZ0h%@z}E=jq>pKZo*AsDD)zDoe#rCsn{O9yU@GyL4R2V7Y5v?+Xe(Z$7G*emeP
z&X8t;F3f~3OouMa1TG9{uZMB~g%#3z1FVpGL}*NEv13w45H~Pr(lo8(CsWEB*74U>
zup@+A*Dpi7mf`F4&^x6~X)NHUa*#4rz$n!zO=id}ka7dO+B*J5dP-9*f1`#`YDJ{1
zOXH!t8>YB$#Px)mub}CQ%#hM2dU?zYVgHHf6%acG8yN28EQok~D@$3!U|%1^ZLmhY
z^F)7tmvm~VY-d0^(G83JK8Pc6x$rPXl3fc+3G&*T%P$WvW2<9Pv3u|YY^+iFq3qw;
zPYzQBUlEdAaNnq@v$JbpU@*Xz2VqY`l!yHfP!5G6MBq(M!i1fLWl_uL<|18z&L5%F
zVgm40?w{0aZW}FM*F;R#uWKU~$FoNH@;8tNx~KcB^tItNMv~0(W9BbayX5G#tw@m8
z)7RHFB)i}eXt4YjFPHWpSWf@6b}#wh+OBnlWEm@kqCv)suy+H3W&lwhs-;EoG>%<;
zgnn;*Bl(#A>-t(Hd#pXQY=aXPomw~ayAxR!TnPs(KM8F4iH|Qop*`1N?H$&2XgCG)
zEe#PN^GdE3AL9}(0kR|X*X#%`NwyOG5+qAs(FH8@RZo(Dt4p*pHM2y;d=ty_AQHiH
zmi84@qTB_(NyV0wo&X;M`Bc4=PI~Owx+T}>gKCIgmMlbpFLTmu_1PK1u==!mCp-(D
zPm=o*8w34DeV`bvZJS(B#<w_R-hAH@uB%{3Rp2Vz*jVSHYa2Yf<mlh)JAC4?FI<vh
zZ(n)~xJfS{s6sG|0GE-V;KjbD{3(&To6a`m=-7vR5!=;N(YV#}4=7fDgti>{3r2dV
zF()76_U~?cZCiLn>vYnzDqQo(tb6-h=5`3%mqh9GCyx|Tp=p)c!e#A114tX18aK57
zGYCD_k+W;+Yq<%I)UOmKh-W!8CRZSRawS2$R@1PWzpf~2SixVfAc$9r(0hG_i1=#0
zVIBQ>Q!*Jy#Gd8N+5)Ki4fBhY*&rW?`)6)JHvF&@NzI#*>8|EXqCr1TKVG9Zh(W<C
z41o^-+0oIf%}Je0Bq$*SUh!pEYYZwLx`??%RGuAx6-WgWms1dyYyy!n!&9?^)p^wc
z8@0C_%0-2f{tCcja_8;!pec;VKEX>sr7yJ<gyJ#j253w8{-ie%Fhz4A_Bw)A1nev0
z)Ds^VW74Rud%=GB<p7oOXLrJzfJKt+l)Q3*PLm~q@nn$Jwyw9_MoIVtdg7AcpyyjN
zZ3aW>1;wr8?5jC%cyA_`MC|Fe>GxZAC#6A0ER(Zmh4q=SJT9vq{GgGhY%D*r8CaYl
z^~=dwTYVCDiPT$!%N2lOvSU+DXgn%tOqy}Tq=g`EV=zgBduB3CED{yj{uv&|ETkkb
zy~T+0N&42tTUfWD%AF>9smdZ^!N!1=LkX%Z_L`_`bM;2$5}Tn4z<RTM1XYVWTo!DG
zE|9d?pO6Tsr|`q-fP>y%nUM`aDHsh{`NLG^6)`ae?gz>bauB7_&Dpsh0CpB6VnH%N
zBJzeci_v0l8cL-~D|4f(wv-dywWC|UO;XrLL;KJMVzL3w(rXA@G_!4wLam@D+jg?e
zpDcKjj?mw<Ws~ny-L~S8QTic_gxz%~`k9DClVG<;=VE4b_*5rb(qbZo&-vhT8Jcq0
zn4s;Eet-atNn+)dMO6P8sf!-s9c+#wxX-NMy6lVe=iAbh_fVu7>Hprgo+Q(Ck5vEp
zc4Ze?N!{DCRSCngd3$Au1tWZ89r+7e!wT*SX{ZriOakm30<?GSjT&x3B#ojlp;RKS
zNAiThhPaF2+1Y?kDoCSBnB+Yb(70ZW9oK6Ju(`fM)2QIDuU7zNiV(o36nM8OV5;G!
zRCVkGTQXMiQ`WS`Dt>C2h}~5pQdZ*7`}{7(o6o@iyn;~Aj#aqbf<C{`LLR<>E3_n!
zK1Ys#*qw!Jx{*Wsj)zx~5L6~=wIE;%fj%=i!lFy`f)@o(wU|W<kY_98q~$)}Bo6&h
z8@B_rcIWp?n&3w9t&Qxa9H)jeM$hwD+J2tMmD?b9a2Iv7=kg6~vq+MSOQ^zmf#qN2
zK#wPVxZ^|d9RI+M4+U6pG(zkME>4tR*zv&+D_$U%2<-OQBXFnS&9Z$SK#lM7P%tyv
zRwT-L!i**p?v22cMO@JJBaX|D3+z@Tw;@2I=*N$PPyV!A3VV;vwy#sJ0@d^Hpvk+6
z*TX)f(z16}y}9bGx;gub*J`d-UhVqU&dV0M`||dS`+)R2Ua(m2{>;AOt{+YRGiy9<
z@`1yXsh&tOdEE5iuHxOQhq-Rp{0A%IOU!sYV_~Mc0_V32!9vF3Is~(nC;4~KF_cdu
z?fEMUai-^>{h4g6?M6*|Vsq82omV=;%bI30n&*<6?@wFks@)}O4VTga&N_u2+g-SN
z74Ue5c-E7zW_q%??+{Oh@Wv{@uwJm9Ok@zmvoxMH{6wM2vyz`!DI&gx_pGOp-Ct4H
z!1YB0c6D~`0k2N4?CB*NXl!>aZP{Cs8V@NaV2m`0;5q<5+C}=(-inGAd<fj`D?fvg
zGufW&J>UEFzBzU3C+gIDek`h=v1gJONV;%InMqaqGPLYv1AYGLwX%I?Qa%vhL!=qj
zE|DnhVwoVJHV_x2Kt#B?V|&tCuPLZ~f|Ha%t=EKGIEM8D)%4wtl2ju!*pawOvcniN
zjG>lINwj5unsd>K=o3;utoLe%4PU^(v6R8x{RU#7zuceaG%T5|VbL2w=sB^~Myn2_
zz_`r^(h7`0b??G1lf>*`N4GAhhaVQ$gL+hS_FP%?g#+olF^=Cnu(mESKf+xg&pr+z
z3v*L|UkB@vnqUUjqj}im)xwV`jKgLH7c}=~qJ!d{LD<@Gut>M~#3uUA!91Pmv<YHe
z#W0+&{o>#rMGlK8zXAM~hPC)Z0ay~;j^yR^FCR^z#}8$aL-e^r>kC;jvLAY)TL0h)
zsoU3iLh6%NB0-NkFk$yjXW-OvAN}p2qUAVP-Zs)HFW;i7L<QUo0$au*(UMRmexn31
zq-=&tKiu`lbYoYxF{+jKOL{xI0@6Ry$Gg6E1jS8W-a~DAAeE7VNMokNg&1?buLBn4
z`@5c8jK89)zQM;H!_`IRAuV#G{SjU=ji8Kn9nK&}Xy|a#DhV$qJ@FkRSjK>2{~)YE
zc;$z|fJ^!Z1gP>-1b`o3IQ{wI7Rw{3A=d!N8dBOzmv?`=sH*1N##^qUk@8tr-8@%e
zuwK+(AQx&eNGp1~{bq6%1ZhwPPtBme?cQV0DjadlWL3;%)y!nojP9PzT63Y5_IO=|
zw`>`gdtU9o(m&EXn_2zC_M5i4NSgcV?wPdGxwMLzG}tUZW|>V}P2cg>hHjgkb7t3!
z*>yY99my_=<QGPY%16~BL*atDTZJVf8{gUb=GL*Y>C)NKJ+p;-Bg-~U7fz>!OWGs(
z6}R#VBk6gsZoRT~q;xiY<tOR;#%e!U``+5=wD9h|v#W6vWq#`KEV?Ae?|Fm88fzi&
zOffIv>=|KwdaO&qWr{82-ltwF`GO%MIa}4ThWi`RQY-vO1=#y!qmg`20oX)2q7xO(
zYG{143L78Q62#YNHtP6karH(e|1n1Z|Cor-`>|3)T*m{x5NE>6=N5eTzd%EFdI5-K
z;Gq3S%!<k&4Qm|=w}yVZtON?<I(m7Z0ha|8_y_Ty3KR?lk{zI6xx?VlLBWJ!*dhe^
z1zTC9y*d;890>}PieYk^oB|(BL%Jk7b0n2*Yig6=%X336_G=thci$jv-F<Ay8do>_
z6%XwGRYp}uyZo?cL1G>U_9x<CpX_8%qGUOZ=je-ahSib<?{Wk0<%kzX=x?^^LdfG2
zltA2w!6fk4I_rg+%PBW?IadSUed_h6VhYjF3ai$smyTULHs>guaTLxvis#J5Gv;FO
zpoP_8UCwQD@!eZCsEPA1^k?SG+vcnbs!OJerf^REc;$F**ws8|ZkaK+{1J8=!jM1t
z*TU`2I6a{%@^XfU=iVb8BK)lY*!#SvicAm!=mf9vl=BmMr>7Y9--}2u7LihpW8ilN
z`M{(tewMIo0{DM}6MLscMbgWNV?-%^8^NmxFxZi<B0w7;*KH&dwlfi^5TL`88W1!C
zh$;sU_d?x>Eh$8W!-Io;awQWTiS#&vvk1^tv-LLVTZmmkfHEe%fq>Z=mhpWTn<EH*
zh(9)ySVF)o)i@BN0vg4r0ZnUDVz-9$ArAiq0{nzgL;P1W-M+rQ&Q9>nxj^-!@NSU9
z2z(jrjig~mItamMP*M`s-qt723d!&>FIQjXFR!||Z(vq%#{{dGdwKZZI5@=$Ii>NA
z!Ypnh^E{w2hQ{2PKp5E>11;S~Mt9D$b8G|Ai>V{t(V8)SZ1<RMrn+&atZAMDVl15+
zdMZQ9#a42)HOAq2Ja<}{D3<Z?-u-tNF@6v1j|~vG-|bCpclbw$*hC`EjLS!_WX9sH
zwHwB3-s_0BZfgwZy3afBh-_q>3BzMv1#<B;-Qmq*XfKJR0SB`PNX^PI_q&_q#%+z|
zLgV?YJ0kWhJm+2#bHl}vwjFo43eh>j$M7_68xKsRGBmsgrVXU{6@Y;SOBUP6h%mDA
zP0c)qc&uur=p6OOxRqkaITo0Qv-4Alh+^{Pjh}LGika2oE;8yK^^Y}=J~dO-5aW<A
z&BK;>ILGX~xPy!YMjOT)qnl^SH^ew3jKfREb4+U%Ysac%9Gu3x*=ag}KZx1a8E)^K
z*>;GL!oH*PoH-=c#@s2$t#Q;o+C8>n^w>-#>~L?G=a3q!;nr**ceqk9X{39!@y*^C
zqT|pDr`Q3KBDRxJcnNqO6UKIq=a225S+#Mxac0#c$f2Fg*YKh}rd5e)x2=u~!!y>r
z5n;w!8WVvMQ*t3|)>ZqAB`>DJwwkjfU$$Q~#5CB_a$4iO4lxJka7G--G1UfzXasse
z$sHY{w@vU%0Y-z(Q1*rH)Qro4E2%Ly1gi2{<2mnz>dVRtt7nW^GaA>t0WbMOqo5XB
z*AuyB%1lGLtp7u(8E7w~N>DWP?`R<<3|M7tMUx&Cj|KwApQP^|vxk^PU{(W@8F_sI
z*CL{(?m@{{wq!>YR&20J1Jr)_VN{=A-pYi=1<VHMvxH7Rs)4M13&a+%-ogwN=Hl=(
zOPO*N8ccDe?;w`PEQA}-d+Ig7^hBR;ofLy6>bn1H0Af5LB+6y~iZlL<GyZ~GHOsB~
z6{r6>m;X!N{6B@Zn?f6W30umXHFw6E`}F1rptigjTi(-KV6W<&qh!WW^7OVP)c?U1
j|AMRhIhS$URe4o4M_=hnw}rH%m0Wo0-#CV_m->GJ8T9I2

diff --git a/ingest_pipeline/storage/__pycache__/weaviate.cpython-312.pyc b/ingest_pipeline/storage/__pycache__/weaviate.cpython-312.pyc
index 999089399aab5bbc84e03a3187a995be3981938d..4b205693ec5e7732c579a890892ce14e5a328d7f 100644
GIT binary patch
delta 8121
zcma)B33yZ2m45d<>1nZK$(DD#$-BTS#w<3AWn)NKLrtJD!zjjj#s+!eN)8xoOcEe8
zUqT?46bK}BXu{Go6rz4j+D`MuVIa-Y27P2=@=6kDGikO?O-QCGGwsYd_sNprgPFe1
z{@;1$u4lRDo_lpIBwiU6<KMDc%>q1@rN8O8<FUQ*X{2Fq@wMgN1h2z4sjIZ5w5zP8
zj0lRPlq(hOVmee+bV>!jHyZ@OD<ig4DrTk1n=})+qA*|ZCT|zKDayp>C1AkQGPz%N
zr3U|*e4pgIL^YwY$LCYp0-ZhG&3#>6t+ZdY%<XCG>r%P{cXqe;u&>2pk`c_5dL;IQ
z{5$JZ9If5xow?o6GL1cC$jX|o7?lidHtn)^_I9~thFA1vA12;8%5*kj$RV}tiXqim
z=QS!b+eL4~c3sOXZ=*6>nS*_KMLzer${dz%oRC`Yz0*4%YPjKj2fQ1037beuV{oDI
zaS~Sq^=URjG5ge1Ra63`OHy@y#n(<<@S&PKo;F{r-|zAGQQq9#ZP)XeVlE)1>|t{j
zDF_}n+jZ%@s!{3o_V#pk2UG)ZqWEbo3&rP<B6c-CtrYvFDF`@A)zq}9P3c87xkOrl
z9HRI|c<1KQDpq5gL@I-=HV+}?Y{Z@}W=pK6b-E>>hZ_6|$ZT0oCY$0(VK2Cix<PS3
zWR=w=_5l*Gjo0yt0XzFBE|YCduv(*By~fS(%0JePTQR1QA>8Qm8ycCy+}y<2uHt|@
z+mV^!wcN5RYq-%PiPqHU__lz3e1_{%*fR}|eETh1C)`|*{WZ}NBZnj0d%43Fmlo+U
zgC(qSkSunuCxhMRNT^2h@~1$cNrO@#?6%-2DFf0W;VJQXqLmLw4~X8>L20YRe&IMv
zn%TCbV`LdCNp4KFQ|>8fI2wmgkKkth<hg|lfpqD(328a9dDTTg`E>xf@PI+zORh64
zK;9jMtuM)#G$!Vn7LrTJ>4!^3Gpa%vRi~!BRCl`WLh_tl^DbHvM=jYQOZKRxFk~rY
z3sc?$AIeLuDVk>`hnf<a%7n9}1n9G6rg>)R>{Q!4y>w2m2l|{@nr96Tre^9$6?<|*
z1KG_!m{4Kw#ChRtRB5depoJ_mGb1h^ndncniMcZ~<#kA|XKk5z#LISO-jm%048I8g
zW#A93!aBVGn{(K!i_;DF!AkF;y}_)k_rzj8N+#B5Lg)ifrIk$$E<(2g?MFSME;4ef
z$bPmc_dc?Uoynavp#%6Q1Xu>EfS?ax)yP6HIqMRiLk>hDVVf`(FPJQJGF#!C?80Vr
zJHQDk+LG?X%Gy$ev9QVxcG_8-coN8K;ZE#YC!ag>vm%|)UAJlYGWPL3gvkIP%g$h1
zUK^>2>Qoo#?^QIvK*3eHXU#g$%k6q3ud)1sUNSkj53taMJ#)X|VL|T?(9T{}-`5LW
zM%;?IiV9>dOc`q~svz&N2aDEC!1=VHrp6z%@PqJw?LXPFLpiMX;WReUV-{}{D%j;x
zWBi~rKnA4y2+bG}*4fzUO_}T`#dAGNp_e5t<E`Bu%IInU)#&T=2RyAlA8mur$ZWA3
z7lCS2HbI5X?zJ&10Sgy^MN(LENrHR@KK*Oix{?VcA15U5>ljTb3#F7D5By}yi7gir
z>UPN&9qFTv!jPkI)KMOClwWXEvO^{1wsQ9jGEzz0({v+M2KNkhu_P-lB7F*Z+_l>r
zFhSq^VfQ9vlL2<VAXy8Qx&a+~CN4=_m%ujo9qc!*MAF1AyJoM_q&CqqXci+nuG`pU
zkDn+%?E!G<W0wB+k^49T%J0X;6<#;YJ8_o$1v2~Dv59k=ZzHWOdDP|%*_@-c!jP?S
zc-;kC)v4O^wpr(mv&Ia9b?SA0BJ}aVoCXsaA*8{e8xh?ye1Kb)2PaMXsg%g4upBDU
zy8%>zHnZG{v_uoV3we<O&Q3Ma7U1IgVRaRiLqEVO#n{ZGE$q(Ciq`G`GL2nIpw-(N
zXyt;drcQrPdk^hu4e(y*7ObP=<(Mn*AfSq!UWyTtZ+hTR6-XaMK%ZC5ZINt2wX)AE
z;&U+us4`XjeZBzYQPc<=u0;Td9%+?M^0#1Z<tK)eLr}6LMyA8?tqEqJPa*v@TR#1Z
z$rwNA3jpAuK6t65ll}<bMi{2Ir`xZD{d3zkEn;-D4Ku3Az3jOe`^ZUFTidb#<);z#
z&}Z<IEA$9b=m+$N2&hg?5ppZ6;BGHPduj2IPvcqkVQmUI#lESXUc+||o2C++j}``w
zB6SQvmApM|s&!3kpsmBBg%m#+YE9id8TCS6WGCy=Ak4pBS4K*L-_(6(AcxpTjT7t`
zL1VPS9l&b1iIZBa34k+p$&^nnDiIfz3v-lp&Ak(}@Y39}Wn2q&*!x+89SCSIO+Ky#
zzKO&kZvw)j2)JL+d<5QY22xgp`&ms>p_8k@qN(8wvUxO&sDU15TbeS8xT1M`F8r^d
zqTd2A?iu(7@Azd?G4Tig(6m7$ZwBwa<Iltrarq^hYt+-%p&5wWgk#-q(k@Ax(3@E4
zEr95r!j3IyBtiDYf}hD4f$8z!v4yh<Il?|!G-vur;J6H`0k+xJK!DQq@U2Q+t(#~7
z>*AhBaqg<#tE}l;>oRD=9A~Q+S7t^f!;LB|8FxuFnVnyp%wAbs47<lCi%*ba!97cI
zMA$%2-IWw~4twRg8D{U?<r?C4<c2l;ABN?#@VE6)#TBpFGKBs77J-|Ln~~dX6nQ-R
z;kzC;9#<c?<^5QSigcN|H2L&6a?pn<*B{zWjnhJkhpXiW?8#*ll3xYB-wY5I6<%P%
zH<vY%cUk;*u4?M73+kKyBo^RWr#T4c0bDvYu3KrP9<5XQAunJlE4qh@k>m?B>aMuW
zsD|-1^a0jLMc^XwoSZvhoMsH};k?I>uo4ecmJNLh?H?a5;+(2Mi&TD1WH2C;Rwlxt
zOj(&vt_5pXnk872O)dE{pUktYyCt)Nk0onk-RSTt@n|tmhJiJufI@!Wl25XOAGCNx
z=xf&MGPww+b%6D*POtwHl2KV=yN)iS&#)4=33{0ShR)wu?Sxe1i`9BUjI65JdE2ak
z1mc*>l+E7Wo5bpC?9-ctd?A{k^W<8LNv`2Mazk=0LUJt)id#kY3(pp^luf-i|4viP
zCd-|z9w+KX@FVa|b{|q)uJDrN(sMy1DAIgp=e^SsnnaKd7ucu5x0op!ne&O1DIec5
z#lGZ7Js^*!O$?<?98IeZrBz=@tGVEqdfqbi+mCH&Z1J9gxtN$eKpI4{-JRvm6Gog!
zkK~!$bEJ_;Hg~NwQmaRLjs*NR0=35<JrEDV|F!e1yLHBG&usD_St|^R>{MwA+f$l^
z>6me@u)19k1|`mXdv7u%CnobCBrJaNh!fJ5%Eyyfs6AOP{#bgRuzE*E-X`J~iQv@@
z>Id{*{bm?@P#%y5^aHY2J}eCy;8^IkB&7`)#*aBfc%(xo42ax*Y3!$iWqRYFajTKp
z+UlK4VcN^-mw*(sDXiU+baMWc&D-ZdI9!IzG1l8wdAIfUc8i*fN7nzqMt?@&jv7RY
z+tQ@DKer`svy5G7OPV}}6}|>g6Qh}d$FE%^XiEdrI&EoarcdzBkyoJUzrr+f$(YVz
zT5`LCRdvm-g%{JZZ!-K>g2g&*kM5$gc+^=Pa#oKzr-hu;Ue;Z3&SIy%Q(c!cb1!D)
zUCb%EYS7I{Ja5k%GYbisqxQUzJ@0&e&A-{Fj-^8nW0}mX)D#wxLk$xfW#NpTG!~IF
zvZ*m&I%BgnW=m(X^+@MSjYUDPQYa5$Oj~k-XwhpGN^SSIcJ=xc5A6K>#>Bt;gvd`s
z{9Hqap$`2n0$PXOgTRA5&wTiP9og<^GnTGESP5|598fj|Dtdjbo!#0Fs85O69C+I!
zSotW+_7yCO#7@=PuEZuFf519B5cqC!(|*8>&U1kESVh|&*lu6m&=2uDVt*|iOwgQw
zhuUbg;`_#nSp7!;ssv$M+eR)S?+o(dH}+7kr>&>2JK(vm)yGw$#<z9Ah7e_P?feqk
zU|6o`O4CkI*V*E(Led-bcl}%>TUc4|nG!BUbk?}Dg)e1zE*CwGrfrx-e#KU7m<Azp
z_l76LA+Bw%e9X2X!@%JpI;a1QpWI%2GOuID#+byzfaQNj_#Xre%vv6)gLpDNg*Sm4
znF7#inrBU4r_T#c!j1%HkaO%(;9~<%MFbLjz0W}mXvih>eRk!(oRuemhHQshiyI{X
zjA$Z4FKFcz$Q58%`YuqaiMDR^@Z^B6I-axKxN)r9*hJn7KDCiz7GmF=C7;6{hFSII
z$yx#u@yQ#~%NR$)`tJj{;$j?1#wnN((y{y||KbkCo$P*W7(P$%X>+$hUC|>>#NQ!s
zmw6Q^zY$<OY`~tX-?Eteku`652P~OCFf3*-h4OinuSjiD60HN4wl;syu52wB;=zi~
zD!Mx4j{Y??e8y3AYq}=aP`*OqKmu1d$VL0Pm6P+y^X=@W$OfZBJb)wz(tnHxZ2M5L
zC`!Q>hIYt9G1FD8ZB%K+n?z5bvrB<c%@>p%b@+SiB%UABqalU<7YY`Q8_|HmkBr8<
zy91p8pW@X{4BVwLf^cvC43pQ*Qf_&9Irnog!E;!KEo1Am(9UF;cf5jqxijxpx}$%?
zHqm&p3O{k}X-WA_i*gtWRLQ4wM}vqfe0GY88`bY;*iR&gKn{)C;NF39tM(fM2;_D+
zSJeng@^r#2HC@DBc_<t(9PH9V`NZ}3t}d~xBG|L5n2?FV{olJP8Nx<jk3E_e$K@Et
zQ4g~hADyLLEo;ugu0NVR^epxt=T&@4K=E|7cK2&566FQI>FM#&RG6Y__A3Fe(%y=v
zU%pX>Wz4|&bMgKi$2f|B9<N%%UAA}n0t(ec#<{3wEi=WFBgn<}?{>;uDO@thP)B!9
zBb`CpV;6MAG0wzo*!igh-YcpGty90|P=95nedRYB(t$(8t?Bpl(jK_63iPXbWkVl?
zWbX7)3#0h-Q-omzE}C{)ppzn^aj9^Us%2w`LKRPpP+>vym2lkGVijLEW@s_KwD}3*
z{e9EOzF@)=|3XM+IHyf#S$k7hj?2v6xic9q%9Elu=hA@0h7*z?u}x+j`|Z_s=#D=;
zr`5&ew9<g?hMZOhIjwF`w^hfU-|vT<Hs?U$cVlzfGU(=(7e}9C0oOsy?U5?O%?e)6
z@;JjK(?dNj8APmy4$MgSSFnqJJ21m3u9bxj6qSB03n>}@|2^_>`@5DhmT<7DsKEkB
zZLzyl7@0(X9w{|7n52;!TZ2w|O{WL?HIvj}VI2n-IB+nyT&jRq<o@>T!AV4AR}Y4=
zkxi$g{bnH40>oVPvCB`o$cM~)Xdd|zE+lhpQ%yotn*kkL20u+ie!w6DgzYWnX>b7%
z`o(?`&KGD}{(vp=21PINiar_cEG4+BOrS}*Hy$#Ga1Z?agNKZMQG2t$ANtPH@HJ)}
zbVTbB+z2yq#%Ke+x6wC%8o$Ae7(m<hbWns=&@P8&vWE|6H2e`Q;e`TjiOX@e$Lb!g
z8x!@``Q%c1*5QuP?3z$^&8fgkTTXAeklwgQzGzR`Z`o^kA|CGXEUDjqZDgZ|ORI22
zKVWrFA$z8{Wnn}o0y!d^+*Q(uEzMmjjTGyVQ>sT!mE@knDxXS~V4bil_H;Y_M-^%Y
zg_3@P3S}q%DTDp$sj?}u=4ZFl%6RsHx`<>S%<yz!=T#Ja9<a9w5xI5N<bP0XAt~!C
zfmoB@w<nEB@V@R(fUb5=aqB>QliLo06F?Zgn%)0&cB&i9<PtwaRclFa2T-oL>}OAx
z%k{`~v(KN-7~=az7Jio^#3L+5Xai6!ez=Y4Y=isDjvlXe73Igm^$5KPk0N9u+>c;E
z&>`$Vz~q7Eqr>ney#PK{eV`9Ab((}l2Zj)Na&iKx*AU)Dn1JwGgi(YK5Y{1p5(WAR
z0uKgbNPUIiMEDEBbp*@=X*4Oqyn@;g^03qa6x_LX4#Ce26OlU^p$5T(<<pRQ1Sr+o
z(CSwrzd6!bSiqM+Jy5DO{4-~p;`4btu;4494PWr}n%5U%ZwRPk{|s3WzTF|buPeT6
zNgB1}huFs9nJESOh2&*vOu+Z6x@-JBwkY_<@RP)C)YoAVys!jbV@Y=X?91ty2LcB(
z#`Hjs8HKdWF%wc|!ED>L`9Srqp^z!(S{$<Aht?x+k#w7W0XeQa-h9GzO+b1qFHOIM
z9G`nWxbN9&qVt7J6WF`YZOll5DV*}Zy!`a$F#+jcFTcj$W2H<vx**l4pHKdhWY8z`
z-*mWKu4+1;ojbZTZWtxCBGd<Sk0p^MU}^Y$$FCWNYrP3exyR%qbqDH_D`-1@@=Ux6
vsO!d=T|M4DpE8@Sf-3MQ_y^gB<BO$_gvsoc;{^$;Y$SQl`fmh$^LGCWu6Upo

delta 7819
zcmaJ`3wTsTmcDgwKhx=SlFo}HkaV7OLLLwaknjo+5Ta3Di$tJla&Mrq(;e$}fP}<=
z;x{nE2vRHZ5P@M7BB+eL<KXUoI>BLP9M?}XI40hiRq%6n&{-vzbw*ir_nf+&bce<1
z5B_`Zsj5?T9(C&6%GCjJxL-_o({7Iw;P>Y1|F&u7j~`FSAX6SM9$uhGN~tobMH~lB
zib0u#&rY)-$R@<5G9^wamz^_#D+-GQIc1k1rz$09C1Aj>siMQ=P74RfLBfiqVp1Ny
zM+!=DibZkiBH62^KQ1kgzN7dSi#&6exv5$f<q1y_d6tr>SdcHnI9cSATNE6Vsmo|F
z$+LHvnx;ki&r!<R6>|=me!!Bxe1>dMYFb2j-Y!E^tvp|usm$V{bTJE*SrLKtigQG?
zEW!d7LjT$FVtElf=fLw$c+TA|Y$Hu|;mwu<#8v<cq7x7bnK^FqT}42;CC#8J{uWvc
zFPhckY4&?n)#Fjo8o9YUZZ59a6l_&0ws_TM#Ty9tl!`VQ+^jT*)C%g|Sk~$dcsDAv
zf~|`y$SHv_of)eX?-rjoq%02wp@&lL@%RG1kjIlBJ{gy27{@2FC;_=G=nI52GoMgV
z>2&tHgq(U@qn7MZ0%|)|Jk3GBAExpJ0~8la(-6=Ynzepgv(knwy&^3`4pCGQp1HZO
zm~uxcsR%bYJS2M(@S3q<<d+D<Bk+ItQ<1GLt|nHNb2wexY+ySlIa$qGXF?YVSw}j{
zB3o24ft^jV+oC)p@-k%8Im1ZI#0)U=0qM!H1FW2Pcd|V-D#RAzp^Fn8*p-?de_LU8
zKJb-fyFEJ45sG7R@!9P97;ciz&5)CCE6B+O-S2eRl1EhAoWeDJtlY`IIc8y}oJm<3
zBW(o&P3aaxksSeHoW`!McN){X#fL=pXXhodj6I)nn%v7)rp~w6DG#i1?8VdtIg3Gr
zTjCy}XnNWJ5D6yqOh#I*3HzwkY<1fB^c-sg8H`Wd*RZEyAU?l8K7Sy-q(8od9Z!3Y
zl(H@9Q;X`W$k7GU>Yc)+WCHXhr?tLPx|HpxFO@Ep8j-G)>Z`*2>DdNS!9LHLNA|MG
z*%gVKaB>5HCT&zgG@rF)XO_8;X+)ThEyfKUAw|`!`0!Hd?a&N<pBkb*?6H~sB0G;X
zGc9}dI6p8{bV2UOk5*uxAiHaP0SSa39RHqJ%xBC-HVUU908Ls|KhI5QH_$2pKobOV
zCzB`GiQFxuiKV+rvo-?1S8$882?)9qyN(9(T32oIDda%n5_Skf34%4AR<h?@Q`|U=
zJ_67yMMu&{v9kmK3)R=Si``RDoO}*g!x15gx{%p<`Qt~0&>wuyz?XqfcOz5+fG&@Q
zf05Trrbg{+2z9h6)P`M9am^ImfcfG3B$8jUtp#nQGJFltRE)zWv2{h`Ot_1I>@F%W
zapRV<(?u2JT{cj(ISc0=vx`whRDSp(TT?uZ<sMFp*}@pmaou7U=@PdPn#rzCN@wL0
z?_Saf0~+1NNW8)eT?3$5(CHqp-%mHdYi#st7G)c>`2riq+VoDaX&M`vm}L48MyM-U
zQcG6a6=(XBwU5^hI7|ASB?Hc?erMHX=Tx@DUG7M!%OQPfq;9;SFWp?1!+zi%ZyVL%
zBZ0l>evEXn99t?|ygr5X?M-FpOOjy&yk0VUp}uGnEyeZfI}NEj5pel50N^&nY`G_p
z`#6A#@sAM;QMaaamgySuHnQWT3+7&NIQMPevwgr()bA)7aFp~rO3u_=c2r-8d&e>F
z9m~8SqhPPTsV2dQhv(E)kUm1{$_#ztB%mP(CWWgf{gYJ3XIc(@=n4Q$pv#b6iSQ2y
zs}Sx3=(W;&kRI(D>B;J5q#H1R*}}@oo~N-(A%JGx0udCXzD`9S_arhctxCu%dqZBX
zvS#(E!ImIx^@iwb9N39{47|Mt-+3^KKAB>^;irb%qFd<@GB7)7anTb-v)52X4f?kz
zvM1neRrsdTOu%dRhx9aNfgxy4{PE4D8C6)N(wWM3)})fJ!}XK@)0}k#dNsyqdK72V
z4Fl>rO;6$bG3J@^m(-skiCYu=_W(RJ;-kIHQ<JXmfL7L3Q$^OW^ELlSo@e#7O<uGE
z9W@g@fv?=KCy~NPpg%!~8pPynYlFj<V&2yi6QA@HylOUIKvihS1BZBrCaI7nUpz2#
z`c$-++o7AP7l)y#=rah<0%(#PY}V`>yrJez9(}K?;K0_I3v)2p)1LvT4uIVC+)@#k
z3qkn%nPsHlrCFbt$r1MHf~*=$b}^Rv-smy^zfNe$BCa{A>NZiXRn!#RM%)U|ux<5=
z!F(6%%a(HU&A>^2g|G{OXI+dH-F!ZzcrwdEYA-?%!G*xZW+G)r*umy5ENtNRir4LR
z5!qwyMNb1yGeX(arfT+)81~3M$dTM_Tqrl)Z`k>Tsc?+_dSNjMhCg5Uph(^buU~wf
zB#myI#+XoA@N19^y8qqPkL0sAaAm&(7?aAhH1=Ub8hfi@B6*Shwc%wGW?FhW{L)>s
z2|3Ab+&yRd^EioFGs7|J4TUJ(4DXuM>fJ_F?2G3d{SESrva+FlquZ=o;xyaTSedS?
z1+Dx9i-ZD1!i$Y{<W+W~v6nm>K6+1%n2T;`?6j+J5I1kijqJKhD4Uz-IMbH8d!i0E
z{~d?(wW!UoG2IEekKaK#Zy|73a`$q7zK6VV2>d+bPUY6*KHh;1JiW$oo#t>?@=ZXw
zInjNZP0v*xZX8^!X5*84ws`&Rie_nV_sJgW-AZ3$eaoES-9IdwPu^kUmfz5gJtLgB
z;xn<}2u_xR@HT+kpxFXo3y&_G{yT4Au2q2^OpyA{kB0LV;A!TO&G;wmk&eJs<5e>c
zQk(7?z5}?#53m!4s}}!YyFxogri*TNv+fF2R~_8x6jZcd%+>~Xy6(#-*TePq#YwQU
z@4Y|Y#Fuu8b=;p_!DlwzZhL6NqbF9=s6deQtNZgwX879u9uZ{SxvtDqfQx*RZC^KT
z?tdW})ht$YbkpH6H@aLw9V7hRbuRd#`|CO*5#JTq(}$*uAtQVB*aWuBHj&rCudKIM
zjaKHo4kj^mFw_)Bg=6Ab0#m@Ri##mKQa5>su&>u|CylJ#n_p&%Ii)Fd(oboI6t0&p
z0f<(3SH07c>Y(0Jn}K~z_zH_WGaEXXHsNDu`XR${+hN;4Mn!){#X!dN{*39DGiok7
zYu|~lWx);QbLu9NU3F5OMd&jVp!+P=x<aWh$x)Xp_2n9oE|h@Z99b^RAP8po{|Nja
zK1cBT$7B^Y3f<&36_jOxuoi;9Ta0bHvLb~&aM&8xEp<sM*<0Erv882hn|MwdvB`m5
zDJ)mEIt*O~+1P0W0md$}If=Q-oJ++nLzhuDJvG{y2z%QMV8-P_z7WDAivPITO)+LS
zcbUeR-2`U0bekSBu@mxKS0fBsLH`0s!H~kn?I|xTy4tyG4rIQ2k$IgFrLre3#x1;V
z;vV5g=4aUJa|9k=FCoQ4E0W51cNC>1MC%1S`sj7+I*b52<CYwU{ZnK`ZKl2riic^+
zWYbb~^aoHax@rcirtWSS%*eitgTD~$_T>GBL094Ftdm&-uIc@*=>x8r{jQl8R$O+?
zW1TJ4`GbjB1BrS4iFsFY3kF?9gZU*l%!bsoFC|k_@{j|@4^3e2w@fWeAxGzB%)3Ll
zSViWikc)R%=O;-QXF2A_ORvWpfqp$nnx7J`+E{4n!2|^PSWh*Wj<rP9+uG(=JaFE(
zw<>{<x&l77cR~yQ%%I1ST7`gS=XIW5jPQzQHS(4tU~L#VwUENf@Mc^{*%qp3^Lu>(
z%1<$4T1-agV==kXXV_=01$Xgmf>}$mw<xh?$4A(QALBg5-;%_+bA8wa&n&9vbhb8-
z*Ygv6AN8|d946^0is!{>GI<tzVo5`L0W=A{{szAO5#b{861E1Z40jdnfe_|=ZW4%;
zO_05#Oss<GKO;b-u<rsHdWrWH%MKQj2g37$uZX0Ree>Y!Wn78qs_{62kHaz?+6ge4
zI)K)kEJ<~;|D}cG0xMLf!B^E<^$D?uo1J?BZ9h^npafo)-$aT#j<1T_-x5<rV2YsM
zAbg8}2~;mDMMxwgYe6H7SxbgzL%Yu}L$t65x6B}Y?Ch40&6POzJ0W~<tCN_~qm6Ws
zo!^$T>Up4{bm4B}-chmVXfZ*5ueWoxzr&`>0GbufQ4c>|`G(_l$Jhj4)KO3R!~PB`
z!sqpe+sB(O;o##;?3$vN52L|3rf7_bIP5<N;I_p?mH{-UW`uFreoLV7$l}qq0|!Pv
zGx)N3{P2J|>B5m30*{^7fKn|0BS$HmeeZVNO+I3I-EV^@zvw<8PH2Soh4cs@7!D9}
z8twyqlU`-#cNFyS<B_i_x=l=*IyTVAr;ldX&^l!*<y*xH8n~^uRspw*cD{I?)T}Vy
z$Py!;J&Agm#uEd3d4D>aeV>W7?Tiz@6~kRSA2s#FEL*cTQ^kunb)Jx~RRIO~4og5=
zUIo!w0{{Gu<{0`lD#%Mc?yG2q!C=-bD+3{4$gjwHa#@C*N2B_a-@<FBlv`e2&ObxJ
z6+gueJO%Mxq4#GecBh)S;FauOcIVyBhV*}MU^Kxr;VZ8Vxub8{rI-sf$*%;WS!LuC
zDynYO&eu@bXjY+<xwUzepx#>I*o*>|8Lm~cfRW%b6+U_!*pK%_GDs3TyC<I%u($WL
zic{_g&;DUCfxFL^AKj455ihWH`!Z}?5uUM+vYq>8>6gKJ)UY@9P3Sp=6WC<MuY?r-
zL8xy{R2Tv%81&Or@R$|{Ux~8P;>B;`#n3jQWCpsE>-RBmV?Gw`5s@uEe@LOa&bSsW
zPA@F+7zM>x%YGNXpU_o<D*4&{(}*1YVE<)9aZEIEr~9r+Ftezcb)l*rQGa8DPn3_*
zE9v0)7QS1eu0%EIpAon%xC(l4Pu-&`@ah*`q{VODq`*CN%;L3(LXm_Ixea7BL@N6;
z2d9yJ;VTFKm5A4{x@^MIiI<j}4=3GHR!TAT4HQ#j>Kh5_8$-ABki=d%tU_6tccgHB
zY*|@~lk%$M6QsBnF*iV(3GPVn)|2mF19ZXt3+d(fkr~d{z;-GHUZmKJw>Ge=dr}V^
zbz}~i1bfo0cd=)x-;JNbYL8AXs+$7UroAp%=u09%_a$5FDx|(FM_q~3S7JoELaLj>
z4jf(Ld<5h}DS_F0^xpIO(Neh0%X+GR0#EAG(A?7zW&p%qRmB~1lR<XJv4wD`ttrlt
zXg0s2XKSJM{N`BFI8=!Lpia!|CNhylzXaEPBHLM*k|#@JYjh&47Gx1?^bS#fvNcaH
ztBKqK*5U%te*7q*m_9~6n9+Fp0Rt983+nf&wd~ucGpnwm74f2rTk(p`v9I=rwL_x8
zzK9GaraWnT+%}Nt>Q8k2Au%7W(&E#<`fn3keSFfQ5*YHZy)KjN&zvMYCjxQKT9+>U
zJfkjI>a!c+y)W4ajJ|XU=rM&ms*Nid2IsMz$1=q+X0e$`2Z18mz}B8vG+xq+-Kcg`
z(Z=v!z%Up*QMmF`RA3q~b_k=Zm+YzEw|F6C{1*bTr@o(<G9<zCrWy}pAImHep0id<
zKPS}^)CH4S%gG7pb72~{_=ybddSSQ`DEB;e^klhdHZte1w@+sF%tvxO0@{QoAl!wp
z0YHma;j+Qk47Vklg0g=1f-$QXazUi_B4i`%K)~hj`+oh<w&1G^oy+&io$#s|L+wz_
z(iCiZvImi$+h>sKLwFM*3*jw<_YnSs;6p&$)Bix=n~s<MH{ccS9PujWOKkZH0jne$
zEg103rFMiQgoy~11m>qzNLq17HBvu9VfJ}mRT=%`7M+O=+>LX9((I8x&^0T5zsCa?
zvE?v^`*p4!o%tvY0WG68Lh1I^qr&@!;w$kf`X5+M$nf`-%Z3uxc4|smzOjK^kcI?&
z{?ahapF>N+7fu}^^=4x&Ho*g1;4zf!FwQ4e#$_K09nKsw;>(al$jBbDaxzYcbL{Rs
zRJFUO-<mUQ<Gj2ud*)5zN-!=VXAEbS_gaSqq=#}djE&^Xg7Ycon=e$Kf1p3S^>h`n
z%loSinfBNAC*<^7bJ+`Lwq`nEUFX#cD}L5FBq06U6~p{FRKn);E=e~V7m>dun~bUa
zZxdW?cO_lOPW0Ym<LTXw)|ef>*_%RU>1Q{O8W*w`p=G(b9>G^$s8#@V(=xL)D7X8S
i*>p8@fq#P9$<~~`o1HsbkhH=<QujabrGQU9=KlcIsb!G>

diff --git a/ingest_pipeline/storage/base.py b/ingest_pipeline/storage/base.py
index b3e4127..2e3e8fa 100644
--- a/ingest_pipeline/storage/base.py
+++ b/ingest_pipeline/storage/base.py
@@ -1,9 +1,136 @@
 """Base storage interface."""
 
+import logging
 from abc import ABC, abstractmethod
 from collections.abc import AsyncGenerator
+from typing import Final
+from types import TracebackType
 
+import httpx
+from pydantic import SecretStr
+
+from ..core.exceptions import StorageError
 from ..core.models import Document, StorageConfig
+from .types import CollectionSummary, DocumentInfo
+
+LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
+
+
+class TypedHttpClient:
+    """
+    A properly typed HTTP client wrapper for HTTPX.
+
+    Provides consistent exception handling and type annotations
+    for storage adapters that use HTTP APIs.
+
+    Note: Some type checkers (Pylance) may report warnings about HTTPX types
+    due to library compatibility issues. The code functions correctly at runtime.
+    """
+
+    client: httpx.AsyncClient
+    _base_url: str
+
+    def __init__(
+        self,
+        base_url: str,
+        *,
+        api_key: SecretStr | None = None,
+        timeout: float = 30.0,
+        headers: dict[str, str] | None = None,
+    ):
+        """
+        Initialize the typed HTTP client.
+
+        Args:
+            base_url: Base URL for all requests
+            api_key: Optional API key for authentication
+            timeout: Request timeout in seconds
+            headers: Additional headers to include with requests
+        """
+        self._base_url = base_url
+
+        # Build headers with optional authentication
+        client_headers: dict[str, str] = headers or {}
+        if api_key:
+            client_headers["Authorization"] = f"Bearer {api_key.get_secret_value()}"
+
+        # Note: Pylance incorrectly reports "No parameter named 'base_url'"
+        # but base_url is a valid AsyncClient parameter (see HTTPX docs)
+        client_kwargs: dict[str, str | dict[str, str] | float] = {
+            "base_url": base_url,
+            "headers": client_headers,
+            "timeout": timeout,
+        }
+        self.client = httpx.AsyncClient(**client_kwargs)  # type: ignore
+
+    async def request(
+        self,
+        method: str,
+        path: str,
+        *,
+        allow_404: bool = False,
+        json: dict[str, object] | None = None,
+        data: dict[str, object] | None = None,
+        files: dict[str, tuple[str, bytes, str]] | None = None,
+        params: dict[str, str | bool] | None = None,
+    ) -> httpx.Response | None:
+        """
+        Perform an HTTP request with consistent error handling.
+
+        Args:
+            method: HTTP method (GET, POST, DELETE, etc.)
+            path: URL path relative to base_url
+            allow_404: If True, return None for 404 responses instead of raising
+            **kwargs: Arguments passed to httpx request
+
+        Returns:
+            HTTP response object, or None if allow_404=True and status is 404
+
+        Raises:
+            StorageError: If request fails
+        """
+        try:
+            response = await self.client.request(  # type: ignore
+                method, path, json=json, data=data, files=files, params=params
+            )
+            response.raise_for_status() # type: ignore
+            return response # type: ignore
+        except Exception as e:
+            # Handle 404 as special case if requested
+            if allow_404 and hasattr(e, 'response') and getattr(e.response, 'status_code', None) == 404: # type: ignore
+                LOGGER.debug("Resource not found (404): %s %s", method, path)
+                return None
+
+            # Convert all HTTP-related exceptions to StorageError
+            error_name = e.__class__.__name__
+            if 'HTTP' in error_name or 'Connect' in error_name or 'Request' in error_name:
+                if hasattr(e, 'response') and hasattr(e.response, 'status_code'): # type: ignore
+                    status_code = getattr(e.response, 'status_code', 'unknown') # type: ignore
+                    raise StorageError(f"HTTP {status_code} error from {self._base_url}: {e}") from e
+                else:
+                    raise StorageError(f"Request failed to {self._base_url}: {e}") from e
+            # Re-raise non-HTTP exceptions
+            raise
+
+    async def close(self) -> None:
+        """Close the HTTP client and cleanup resources."""
+        try:
+            await self.client.aclose()
+        except Exception as e:
+            LOGGER.warning("Error closing HTTP client: %s", e)
+
+    async def __aenter__(self) -> "TypedHttpClient":
+        """Async context manager entry."""
+        return self
+
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: TracebackType | None
+    ) -> None:
+        """Async context manager exit."""
+        await self.close()
 
 
 class BaseStorage(ABC):
@@ -164,12 +291,12 @@ class BaseStorage(ABC):
         """
         return []
 
-    async def describe_collections(self) -> list[dict[str, object]]:
+    async def describe_collections(self) -> list[CollectionSummary]:
         """
         Describe available collections with metadata (if supported by backend).
 
         Returns:
-            List of collection metadata dictionaries, empty list if not supported
+            List of collection metadata, empty list if not supported
         """
         return []
 
@@ -206,7 +333,7 @@ class BaseStorage(ABC):
         offset: int = 0,
         *,
         collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
+    ) -> list[DocumentInfo]:
         """
         List documents in the storage backend (if supported).
 
@@ -216,7 +343,7 @@ class BaseStorage(ABC):
             collection_name: Collection to list documents from
 
         Returns:
-            List of document dictionaries with metadata
+            List of document information with metadata
 
         Raises:
             NotImplementedError: If backend doesn't support document listing
diff --git a/ingest_pipeline/storage/openwebui.py b/ingest_pipeline/storage/openwebui.py
index 114bb46..8e42d0c 100644
--- a/ingest_pipeline/storage/openwebui.py
+++ b/ingest_pipeline/storage/openwebui.py
@@ -1,33 +1,49 @@
 """Open WebUI storage adapter."""
 
+
 import asyncio
+import contextlib
 import logging
-from typing import TYPE_CHECKING, Final, TypedDict, cast
+from typing import Final, TypedDict, cast
 
-import httpx
 from typing_extensions import override
 
-if TYPE_CHECKING:
-    # Type checking imports - these will be ignored at runtime
-    from httpx import AsyncClient, ConnectError, HTTPStatusError, RequestError
-else:
-    # Runtime imports that work properly
-    AsyncClient = httpx.AsyncClient
-    ConnectError = httpx.ConnectError
-    HTTPStatusError = httpx.HTTPStatusError
-    RequestError = httpx.RequestError
-
 from ..core.exceptions import StorageError
 from ..core.models import Document, StorageConfig
-from .base import BaseStorage
+from .base import BaseStorage, TypedHttpClient
+from .types import CollectionSummary, DocumentInfo
 
 LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
 
 
+class OpenWebUIFileResponse(TypedDict, total=False):
+    """OpenWebUI API file response structure."""
+    id: str
+    filename: str
+    name: str
+    content_type: str
+    size: int
+    created_at: str
+    meta: dict[str, str | int]
+
+
+class OpenWebUIKnowledgeBase(TypedDict, total=False):
+    """OpenWebUI knowledge base response structure."""
+    id: str
+    name: str
+    description: str
+    files: list[OpenWebUIFileResponse]
+    data: dict[str, str]
+    created_at: str
+    updated_at: str
+
+
+
+
 class OpenWebUIStorage(BaseStorage):
     """Storage adapter for Open WebUI knowledge endpoints."""
 
-    client: AsyncClient
+    http_client: TypedHttpClient
     _knowledge_cache: dict[str, str]
 
     def __init__(self, config: StorageConfig):
@@ -39,13 +55,9 @@ class OpenWebUIStorage(BaseStorage):
         """
         super().__init__(config)
 
-        headers: dict[str, str] = {}
-        if config.api_key:
-            headers["Authorization"] = f"Bearer {config.api_key}"
-
-        self.client = AsyncClient(
+        self.http_client = TypedHttpClient(
             base_url=str(config.endpoint),
-            headers=headers,
+            api_key=config.api_key,
             timeout=30.0,
         )
         self._knowledge_cache = {}
@@ -59,60 +71,45 @@ class OpenWebUIStorage(BaseStorage):
                     self.config.collection_name,
                     create=True,
                 )
-
-        except ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
         except Exception as e:
             raise StorageError(f"Failed to initialize Open WebUI: {e}") from e
 
     async def _create_collection(self, name: str) -> str:
         """Create knowledge base in Open WebUI."""
-        try:
-            response = await self.client.post(
-                "/api/v1/knowledge/create",
-                json={
-                    "name": name,
-                    "description": "Documents ingested from various sources",
-                    "data": {},
-                    "access_control": None,
-                },
-            )
-            response.raise_for_status()
-            result = response.json()
-            knowledge_id = result.get("id")
+        response = await self.http_client.request(
+            "POST",
+            "/api/v1/knowledge/create",
+            json={
+                "name": name,
+                "description": "Documents ingested from various sources",
+                "data": {},
+                "access_control": None,
+            },
+        )
+        if response is None:
+            raise StorageError("Unexpected None response from knowledge base creation")
+        result = response.json()
+        knowledge_id = result.get("id")
 
-            if not knowledge_id or not isinstance(knowledge_id, str):
-                raise StorageError("Knowledge base creation failed: no ID returned")
+        if not knowledge_id or not isinstance(knowledge_id, str):
+            raise StorageError("Knowledge base creation failed: no ID returned")
 
-            return str(knowledge_id)
+        return str(knowledge_id)
 
-        except ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed during creation: {e}") from e
-        except HTTPStatusError as e:
-            raise StorageError(
-                f"OpenWebUI returned error {e.response.status_code} during creation: {e}"
-            ) from e
-        except RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed during creation: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to create knowledge base: {e}") from e
-
-    async def _fetch_knowledge_bases(self) -> list[dict[str, object]]:
+    async def _fetch_knowledge_bases(self) -> list[OpenWebUIKnowledgeBase]:
         """Return the list of knowledge bases from the API."""
-        response = await self.client.get("/api/v1/knowledge/list")
-        response.raise_for_status()
+        response = await self.http_client.request("GET", "/api/v1/knowledge/list")
+        if response is None:
+            return []
         data = response.json()
         if not isinstance(data, list):
             return []
-        normalized: list[dict[str, object]] = []
+        normalized: list[OpenWebUIKnowledgeBase] = []
         for item in data:
             if isinstance(item, dict):
-                item_dict: dict[str, object] = item
-                normalized.append({str(k): v for k, v in item_dict.items()})
+                # Cast to our expected structure
+                kb_item = cast(OpenWebUIKnowledgeBase, item)
+                normalized.append(kb_item)
         return normalized
 
     async def _get_knowledge_id(
@@ -171,12 +168,14 @@ class OpenWebUIStorage(BaseStorage):
             if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
                 filename = f"{filename}.txt"
             files = {"file": (filename, document.content.encode(), "text/plain")}
-            response = await self.client.post(
+            response = await self.http_client.request(
+                "POST",
                 "/api/v1/files/",
                 files=files,
                 params={"process": True, "process_in_background": False},
             )
-            response.raise_for_status()
+            if response is None:
+                raise StorageError("Unexpected None response from file upload")
 
             file_data = response.json()
             file_id = file_data.get("id")
@@ -185,19 +184,14 @@ class OpenWebUIStorage(BaseStorage):
                 raise StorageError("File upload failed: no file ID returned")
 
             # Step 2: Add file to knowledge base
-            response = await self.client.post(
-                f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
+            response = await self.http_client.request(
+                "POST",
+                f"/api/v1/knowledge/{knowledge_id}/file/add",
+                json={"file_id": file_id}
             )
-            response.raise_for_status()
-
+    
             return str(file_id)
 
-        except ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
         except Exception as e:
             raise StorageError(f"Failed to store document: {e}") from e
 
@@ -229,12 +223,14 @@ class OpenWebUIStorage(BaseStorage):
                 if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
                     filename = f"{filename}.txt"
                 files = {"file": (filename, doc.content.encode(), "text/plain")}
-                upload_response = await self.client.post(
+                upload_response = await self.http_client.request(
+                    "POST",
                     "/api/v1/files/",
                     files=files,
                     params={"process": True, "process_in_background": False},
                 )
-                upload_response.raise_for_status()
+                if upload_response is None:
+                    raise StorageError(f"Unexpected None response from file upload for document {doc.id}")
 
                 file_data = upload_response.json()
                 file_id = file_data.get("id")
@@ -244,10 +240,11 @@ class OpenWebUIStorage(BaseStorage):
                         f"File upload failed for document {doc.id}: no file ID returned"
                     )
 
-                attach_response = await self.client.post(
-                    f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
+                await self.http_client.request(
+                    "POST",
+                    f"/api/v1/knowledge/{knowledge_id}/file/add",
+                    json={"file_id": file_id}
                 )
-                attach_response.raise_for_status()
 
                 return str(file_id)
 
@@ -273,14 +270,6 @@ class OpenWebUIStorage(BaseStorage):
 
             return file_ids
 
-        except ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed during batch: {e}") from e
-        except HTTPStatusError as e:
-            raise StorageError(
-                f"OpenWebUI returned error {e.response.status_code} during batch: {e}"
-            ) from e
-        except RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed during batch: {e}") from e
         except Exception as e:
             raise StorageError(f"Failed to store batch: {e}") from e
 
@@ -298,6 +287,7 @@ class OpenWebUIStorage(BaseStorage):
         Returns:
             Always None - retrieval not supported
         """
+        _ = document_id, collection_name  # Mark as used
         # OpenWebUI uses file-based storage without direct document retrieval
         # This will cause the base check_exists method to return False,
         # which means documents will always be re-scraped for OpenWebUI
@@ -323,35 +313,20 @@ class OpenWebUIStorage(BaseStorage):
                 return False
 
             # Remove file from knowledge base
-            response = await self.client.post(
-                f"/api/v1/knowledge/{knowledge_id}/file/remove", json={"file_id": document_id}
+            await self.http_client.request(
+                "POST",
+                f"/api/v1/knowledge/{knowledge_id}/file/remove",
+                json={"file_id": document_id}
             )
-            response.raise_for_status()
 
-            delete_response = await self.client.delete(f"/api/v1/files/{document_id}")
-            if delete_response.status_code == 404:
-                return True
-            delete_response.raise_for_status()
+            await self.http_client.request(
+                "DELETE",
+                f"/api/v1/files/{document_id}",
+                allow_404=True
+            )
             return True
-
-        except ConnectError as exc:
-            LOGGER.error(
-                "Failed to reach OpenWebUI when deleting file %s", document_id, exc_info=exc
-            )
-            return False
-        except HTTPStatusError as exc:
-            LOGGER.error(
-                "OpenWebUI returned status error %s when deleting file %s",
-                exc.response.status_code if exc.response else "unknown",
-                document_id,
-                exc_info=exc,
-            )
-            return False
-        except RequestError as exc:
-            LOGGER.error("Request error deleting file %s from OpenWebUI", document_id, exc_info=exc)
-            return False
         except Exception as exc:
-            LOGGER.error("Unexpected error deleting file %s", document_id, exc_info=exc)
+            LOGGER.error("Error deleting file %s from OpenWebUI", document_id, exc_info=exc)
             return False
 
     async def list_collections(self) -> list[str]:
@@ -370,12 +345,6 @@ class OpenWebUIStorage(BaseStorage):
                 for kb in knowledge_bases
             ]
 
-        except ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
         except Exception as e:
             raise StorageError(f"Failed to list knowledge bases: {e}") from e
 
@@ -396,8 +365,11 @@ class OpenWebUIStorage(BaseStorage):
                 return True
 
             # Delete the knowledge base using the OpenWebUI API
-            response = await self.client.delete(f"/api/v1/knowledge/{knowledge_id}/delete")
-            response.raise_for_status()
+            await self.http_client.request(
+                "DELETE",
+                f"/api/v1/knowledge/{knowledge_id}/delete",
+                allow_404=True
+            )
 
             # Remove from cache if it exists
             if collection_name in self._knowledge_cache:
@@ -406,45 +378,25 @@ class OpenWebUIStorage(BaseStorage):
             LOGGER.info("Successfully deleted knowledge base: %s", collection_name)
             return True
 
-        except HTTPStatusError as e:
-            # Handle 404 as success (already deleted)
-            if e.response.status_code == 404:
-                LOGGER.info("Knowledge base %s was already deleted or not found", collection_name)
-                return True
-            LOGGER.error(
-                "OpenWebUI returned error %s when deleting knowledge base %s",
-                e.response.status_code,
-                collection_name,
-                exc_info=e,
-            )
-            return False
-        except ConnectError as e:
-            LOGGER.error(
-                "Failed to reach OpenWebUI when deleting knowledge base %s",
-                collection_name,
-                exc_info=e,
-            )
-            return False
-        except RequestError as e:
-            LOGGER.error(
-                "Request error deleting knowledge base %s from OpenWebUI",
-                collection_name,
-                exc_info=e,
-            )
-            return False
         except Exception as e:
-            LOGGER.error("Unexpected error deleting knowledge base %s", collection_name, exc_info=e)
+            if hasattr(e, 'response'):
+                response_attr = getattr(e, 'response', None)
+                if response_attr is not None and hasattr(response_attr, 'status_code'):
+                    with contextlib.suppress(Exception):
+                        status_code = response_attr.status_code  # type: ignore[attr-defined]
+                        if status_code == 404:
+                            LOGGER.info("Knowledge base %s was already deleted or not found", collection_name)
+                            return True
+            LOGGER.error(
+                "Error deleting knowledge base %s from OpenWebUI",
+                collection_name,
+                exc_info=e,
+            )
             return False
 
-    class CollectionSummary(TypedDict):
-        """Structure describing a knowledge base summary."""
-
-        name: str
-        count: int
-        size_mb: float
 
 
-    async def _get_knowledge_base_count(self, kb: dict[str, object]) -> int:
+    async def _get_knowledge_base_count(self, kb: OpenWebUIKnowledgeBase) -> int:
         """Get the file count for a knowledge base."""
         kb_id = kb.get("id")
         name = kb.get("name", "Unknown")
@@ -454,17 +406,22 @@ class OpenWebUIStorage(BaseStorage):
 
         return await self._count_files_from_detailed_info(str(kb_id), str(name), kb)
 
-    def _count_files_from_basic_info(self, kb: dict[str, object]) -> int:
+    def _count_files_from_basic_info(self, kb: OpenWebUIKnowledgeBase) -> int:
         """Count files from basic knowledge base info."""
         files = kb.get("files", [])
         return len(files) if isinstance(files, list) and files is not None else 0
 
-    async def _count_files_from_detailed_info(self, kb_id: str, name: str, kb: dict[str, object]) -> int:
+    async def _count_files_from_detailed_info(self, kb_id: str, name: str, kb: OpenWebUIKnowledgeBase) -> int:
         """Count files by fetching detailed knowledge base info."""
         try:
             LOGGER.debug(f"Fetching detailed info for KB '{name}' from /api/v1/knowledge/{kb_id}")
-            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
-            detail_response.raise_for_status()
+            detail_response = await self.http_client.request(
+                "GET",
+                f"/api/v1/knowledge/{kb_id}"
+            )
+            if detail_response is None:
+                LOGGER.warning(f"Knowledge base '{name}' (ID: {kb_id}) not found")
+                return self._count_files_from_basic_info(kb)
             detailed_kb = detail_response.json()
 
             files = detailed_kb.get("files", [])
@@ -477,21 +434,18 @@ class OpenWebUIStorage(BaseStorage):
             LOGGER.warning(f"Failed to get detailed info for KB '{name}' (ID: {kb_id}): {e}")
             return self._count_files_from_basic_info(kb)
 
-    async def describe_collections(self) -> list[dict[str, object]]:
+    async def describe_collections(self) -> list[CollectionSummary]:
         """Return metadata about each knowledge base."""
         try:
             knowledge_bases = await self._fetch_knowledge_bases()
-            collections: list[dict[str, object]] = []
+            collections: list[CollectionSummary] = []
 
             for kb in knowledge_bases:
-                if not isinstance(kb, dict):
-                    continue
-
                 count = await self._get_knowledge_base_count(kb)
                 name = kb.get("name", "Unknown")
                 size_mb = count * 0.5  # rough heuristic
 
-                summary: dict[str, object] = {
+                summary: CollectionSummary = {
                     "name": str(name),
                     "count": count,
                     "size_mb": float(size_mb),
@@ -535,8 +489,13 @@ class OpenWebUIStorage(BaseStorage):
                 return 0
 
             # Get detailed knowledge base information to get accurate file count
-            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
-            detail_response.raise_for_status()
+            detail_response = await self.http_client.request(
+                "GET",
+                f"/api/v1/knowledge/{kb_id}"
+            )
+            if detail_response is None:
+                LOGGER.warning(f"Knowledge base '{collection_name}' (ID: {kb_id}) not found")
+                return self._count_files_from_basic_info(kb)
             detailed_kb = detail_response.json()
 
             files = detailed_kb.get("files", [])
@@ -549,7 +508,7 @@ class OpenWebUIStorage(BaseStorage):
             LOGGER.warning(f"Failed to get count for collection '{collection_name}': {e}")
             return 0
 
-    async def get_knowledge_by_name(self, name: str) -> dict[str, object] | None:
+    async def get_knowledge_by_name(self, name: str) -> OpenWebUIKnowledgeBase | None:
         """
         Get knowledge base details by name.
 
@@ -560,13 +519,14 @@ class OpenWebUIStorage(BaseStorage):
             Knowledge base details or None if not found
         """
         try:
-            response = await self.client.get("/api/v1/knowledge/list")
-            response.raise_for_status()
+            response = await self.http_client.request("GET", "/api/v1/knowledge/list")
+            if response is None:
+                return None
             knowledge_bases = response.json()
 
             return next(
                 (
-                    {str(k): v for k, v in kb.items()}
+                    cast(OpenWebUIKnowledgeBase, kb)
                     for kb in knowledge_bases
                     if isinstance(kb, dict) and kb.get("name") == name
                 ),
@@ -587,6 +547,7 @@ class OpenWebUIStorage(BaseStorage):
         exc_tb: object | None,
     ) -> None:
         """Async context manager exit."""
+        _ = exc_type, exc_val, exc_tb  # Mark as used
         await self.close()
 
     async def list_documents(
@@ -595,7 +556,7 @@ class OpenWebUIStorage(BaseStorage):
         offset: int = 0,
         *,
         collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
+    ) -> list[DocumentInfo]:
         """
         List documents (files) in a knowledge base.
 
@@ -645,11 +606,8 @@ class OpenWebUIStorage(BaseStorage):
             paginated_files = files[offset : offset + limit]
 
             # Convert to document format with safe field access
-            documents: list[dict[str, object]] = []
+            documents: list[DocumentInfo] = []
             for i, file_info in enumerate(paginated_files):
-                if not isinstance(file_info, dict):
-                    continue
-
                 # Safely extract fields with fallbacks
                 doc_id = str(file_info.get("id", f"file_{i}"))
 
@@ -663,7 +621,9 @@ class OpenWebUIStorage(BaseStorage):
                     filename = file_info["name"]
                 # Check meta.name (from FileModelResponse schema)
                 elif isinstance(file_info.get("meta"), dict):
-                    filename = file_info["meta"].get("name")
+                    meta = file_info.get("meta")
+                    if isinstance(meta, dict):
+                        filename = meta.get("name")
 
                 # Final fallback
                 if not filename:
@@ -673,28 +633,28 @@ class OpenWebUIStorage(BaseStorage):
 
                 # Extract size from meta if available
                 size = 0
-                if isinstance(file_info.get("meta"), dict):
-                    size = file_info["meta"].get("size", 0)
+                meta = file_info.get("meta")
+                if isinstance(meta, dict):
+                    size = meta.get("size", 0)
                 else:
                     size = file_info.get("size", 0)
 
                 # Estimate word count from file size (very rough approximation)
                 word_count = max(1, int(size / 6)) if isinstance(size, (int, float)) else 0
 
-                documents.append(
-                    {
-                        "id": doc_id,
-                        "title": filename,
-                        "source_url": "",  # OpenWebUI files don't typically have source URLs
-                        "description": f"File: {filename}",
-                        "content_type": str(file_info.get("content_type", "text/plain")),
-                        "content_preview": f"File uploaded to OpenWebUI: {filename}",
-                        "word_count": word_count,
-                        "timestamp": str(
-                            file_info.get("created_at") or file_info.get("timestamp", "")
-                        ),
-                    }
-                )
+                doc_info: DocumentInfo = {
+                    "id": doc_id,
+                    "title": filename,
+                    "source_url": "",  # OpenWebUI files don't typically have source URLs
+                    "description": f"File: {filename}",
+                    "content_type": str(file_info.get("content_type", "text/plain")),
+                    "content_preview": f"File uploaded to OpenWebUI: {filename}",
+                    "word_count": word_count,
+                    "timestamp": str(
+                        file_info.get("created_at") or file_info.get("timestamp", "")
+                    ),
+                }
+                documents.append(doc_info)
 
             return documents
 
@@ -721,10 +681,5 @@ class OpenWebUIStorage(BaseStorage):
 
     async def close(self) -> None:
         """Close client connection."""
-        if hasattr(self, "client") and self.client:
-            try:
-                await self.client.aclose()
-            except Exception as e:
-                import logging
-
-                logging.warning(f"Error closing OpenWebUI client: {e}")
+        if hasattr(self, "http_client"):
+            await self.http_client.close()
diff --git a/ingest_pipeline/storage/r2r/__pycache__/storage.cpython-312.pyc b/ingest_pipeline/storage/r2r/__pycache__/storage.cpython-312.pyc
index 1efdbbbacf1325468cebf2e7eff5c404fd7af3b8..bfe63edb68cbb9803d944dec48e8f794be94e034 100644
GIT binary patch
literal 50082
zcmdqK34B|}nJ4%jZV&(g0^ogtH^EyHb&<L#Qny6el5E+O6^0@pi4qU>18G?Z=y+^T
zH=VdA^d{YsI?kG!xZ6}mX*20`hx41B9#N9pN^j5p9t1i-qdBw6w0Czhd(p>CY&ko-
z|F0h20Scm=p5EQxZ=bDVq25>Z>ec(|yXvd2{yT>wi^KJYNB_;)b8m9o-_sBIGD;c#
zlX{-xE^`5{j|=bt-7r6*>(lX+*AMIa^z5&p&w#&%VdIFY&opB0GmlvMEF;!FD}yr*
zXN}nUY$I8HS?srI*goRubBtv7Wsf-foUF_|>>A1G%NcR^x!G^auxG^E=N-xI%Voc<
z!+9h5efc8=eFf}y)^OoSQC|`Awt#)Oc%-DSgykK>r6Xm1Wh3Q%<s-g6-$+GY1<JDn
z&f&_Ds=g|gcMVsM)b!QxoQ?}-2XcOZ_oJ(?Hc%LFziQ~K3ls%B_*)++4tVj`A1Ddr
z;%`HsG*A}Ed)3(2sN?o<f&5pwKtZtT2l`a~rb~K%`GXBd)*kVN#>a$#GeO_b$c5qH
zNN{v~V0>t7)He|t8a?A1KO6LoojyG@I5aTqBj}?&2U>nfjrjSbZD4eCOac$}`VGnK
zuF$2?!9BszpfG?&la_ts$ekJvCe4QiE?hu+Nz2jTZ%qV82ZMfHQvcMk?xZC!FdiHq
z8VUOKNyE|L@ad%a*rf}>rw4?jVQ?Tc4miV8PwneT8Yd=(0`2%|V^8TG9zs`>&b`Nu
zJ#iF$m<a6>gfRj4v(Zg0h#kLoy)YQOK(B>fTgILb3c^qz_)8iL6xfeSBOo<kNLqTv
z1}A7Bk}f%SC^$ZVjt(T9`$o?ML)6mIu?b-?m~^BncaM#p9y;?&U20@@4upcKJM;v(
zoqeOH$CCW9!PIA@apcVSho11C{6}OibK}ar2scj6vFit^oKQQSLUxWDr<&|i;l?dW
z8JjNj>$I*AX@ry8kdf#pH|~(3BbX%eeWC3i{)}_ka*OI;xn1?SL)=l$uj@@(`uhVz
zgX8`EeoHcI2nZJ%9{_F$^kPW^-4dvWNquNsNSek@oeK_*C(UOELIdODg5blg>wMDq
z{J`);Fhs-VdvLJz?AS=K_4$F&U=Y|j6l}d9j8U~vE0DZ-WMCAiF0=v_@fG_o3|$Bg
z4~+&}Q*)qISS!f+mJ64Xw*G-o|A>UTf*%i{febx`<Rxy&oHJeXX8xkNV#(?GPS2b9
zZ+qT8JyRSlY@VHndDq9B8$`>7C3E)F#Pqq0K<~bI{l%DfTg<s#v}{k<953zr1Pya(
zxM4s6!wmtM$Kr-f{ciZ$DLleg)?$>2o<W!VRfI>>3h?xe!qq@*%$IQ=8)e`4m~X&0
zJ^@Mrvfz`xNT}sH=QjuyXjCBdOBxw~K#vk?kx1W0sHb~&8q!dT2na1GqIx09yu^LT
z#<XD3T)E`*PCxa{h-fKZDz2Fc-gsuQc*E=Kr*pr#MKo-i--$$MK$Ssdg5U>D3^rK5
zk4*Yt$%8Sei|B-$i0&NVR$iC@seu~h1KgxOqJODSJD{2g;!vj^O`HHH(^XbW7s1et
zTjlm6dbwQ*>2*T^zmZ{6Qhz2mF4O=pX-1AAbrpVrl$t^kd9j=x7#=<~FnB&`PT?UY
zN&vKJ==4xf2oZkxa7klp>kqy#E(~Bo4F!aaxJ4r#I*bJ9nq7FMHkMuS(w@JqZJy4*
zT>M7ym1B!Jm2>Sc?N69<M04SrXJ$^%1{TZKE#;P6d3xs9Y<n!XZ7M5~Um@oEr#4~8
zZ-nMLe(-f=>=m@a1L#|`vFA{lKK3ecQczA80Rc!uOL`G@DKMMVF+QgdH5m%TPa$ve
z=&r}3$CdAT&aT4BIdxJD>H?4w@ZD1Q!&86Mx*3SrxJzzDe%?{8idzHRz6c59Sv;HP
zUax#X|15Wrzs~pit<rp;UJCS0lUajfqvQBK!$YT%me9n73qmjyN@hJx#EWsBq~o+O
zHZl|%J3S_h42&oBqhl8Z!lKM`NamZuc7U|uU+AkyWV%FiDB<)@*(EaNSu~d}Ir8HU
zU)14yyC~*p`iSGLYnD94agRUh@z2)8JZ-<yqllG%X!Cq)%WGTS)W>WkqM_thM%-AY
z3J*dyJmfEOyV~^&?Z&RH=FAh&_hpda5p?G<Xz?)Wd})f7*0O?9G71RQR!rpx_dF+f
z)oHIHp^7{z0;q86-J={$|0)fFR&#=pN9myMS)kcPPC^p!zXyDa-^B1FX*e}DHk{NC
zLFh1^9v&MQXGkM#!D#z+LLL4j&4J+Qfr;Vq5aFym<;_G+QA^m3!p-;>dIgD$1>Qw-
z*^<*ez5bhF(Nd_Qf(A2k7tQ6FK$dlSYjL8!adzUm{X6TvGjZjqZ%1ODYSG^F7gh7Y
zf7yV{vWc^MUh4hqQzPdp`WWa@obVKVqjwo-RQw=RfPO3#<#%o87S?7_y4|+Zp}%G4
zkq+XXaw)?5eoVmM0r3cOeITiQx&RN6ea#ei8lwEGc8Kk31A2(I#=yFO0e?+FbD%w7
zeAV!SR8xJH!1{m*cdWQ$4p`pg0~-R?S53<OEV<mu$^Qj52C_5|w!o%<4K3IMn*(<I
zbp$#B4*boQ;pM-9&OkQGo$_z`8`u(XqRgc&W93@|E|ljyRK6{cgL3yn<=dHP?^#(c
z{|@Y6BEMJuz4C9Mi>U&+ft^eh$P08s5is=SXL$P_C<f~I6a;n!b_WWeG!zE*1PW27
zNZWQ`Z=eWe#o98;2lfSuQC^avyaeT?+Va5uKq<<~R+N>Ytb9dTIm&!1%6urRSW#Ai
zvdX}LKqdZG1<iCfa8UaGT1Y7$I25RQ)vRDdwLB()-axfxBx;oM!+{!2c`eG@1GO5Q
zs|!34sKb-%S3WE7WS}19evIjnfFEPp5I7oWKuIIoI2LHsw9yoJD$s;G&4H%_&G_3A
zI38%h-&Xu>#oxBnTRoHMtpd*m+B9#3`SJqaw-%yCUos1tPf7_9h-jn{YfLtYW6vY=
zdpvk{Y8r9eYap_}i)k5ABqDIu)HJ2ia|+2-swm>-IYsVK@2QeigzKm0vTK}J3A-ZP
zYAvFU^1J|g)~~2Nmvnx8xNhI*&^WZyp>U8Xs3}q2cX4R^ENQF0L8d9TJm6b<p=KDt
zdV^3+`$08_pm|8l*%BNLTo@zjYZ9Pq3|$c1=vmSv)lKH6NN@k(*zhov38;S%u}EVL
zk;ZBQYlrfewD$K84iAJv{rw?&OP}v0CYK2Z@gwX}KSqoE@B_FJ>PGSzWM7NpHFMNb
za3yci;#(^9&E&mPeyu!Kx+Y$_DO$Q|-V-a`I%Rm>u~geWckHJpe{?cd+l}A0#G3U}
zh7T;2l02MICVPM<z$yYVI>b-%S~hr2D?bB@u7F-)iAUA1p6Lsz%BIW`Ne08$%+TsN
z<!eh%p;VrRlRAwesvB3NFQp&G2p`dfy&N|Q%MJY}-yyatGu(7pjLK7t))-#1CphlI
zM+yyv#vwcV$Y|g@8ypBgg!Vz)@&$$jd{$rA6Z?FF5V%7vVLS95f^8;iMA!u#aCm5t
zSw>pVg~mpq$3SB5PqhKWVq&~NvbNAcNhgw|Rk1q=q%=w*VI^{Yz3?Ofm{ScTZK1$<
zxwRDXq=fnc=|SV;7l2%3^N_*9Ra%T<y?Geu2%ZuOA$f_r@2L>0){E{9Q|3=C;M~*g
zmpk9+oXK9awJzlp$8)NqIn{4J8_Q|^h|@b76J?ceoxgfMUbZ1xwjoxwY1+2rDZO(3
zM*E_tE#WP`^0lb9VS3N6%m7`saIXBR?5T@W*}t-?za?4mCv9DA`h_-QSBE*XW=kT@
zWkMP)>Y|J;1wnXKIFIlF{)SFQ0MI#ocw4s+gcZp*;DfS{**$!TJ~n3Lgb)l!A6pu_
z%-{Nq^ssF^AZZ;(K4~U<)Yt@UPr|eKEs*GsJbf_+kS2k7`Ulz5`_HPQA1>2=nuqWA
zqoq(O5_}bRUfkUpb+^XcYo^Rg&Z3!(b3KdB&7x)V!!w#_@GE30s>TdEfVp-V%+9LO
zq%zGsbr3Pgiq?ddQWtbq?wn!>l1nv%Z?JL^!#SsVN6tm`-{k^^@9E^({|Xn-eGQcF
z_YIfzzil*flg5bgT#gK_{*`-#*=soGQOo6=d|zo#FSW;LORfy1{zd=u)L(M$97&)n
zu7`S>YI%~sq=U$Akij9cOSW6xu%2uN8M&IG*OUJD`n$4Vzma?WMf`iF>dU+xo+yph
zMwl;nML9tI1L#kYra#_E(>S3Fy8_0D>ARdd@)6U^x`1xd^rGn^FZbhz`is2Z6yCmq
zKVoK#N-WGbFdFa$M?;t;z7&JQypb84FZcqeWvE5K2jzOh&Ans3;PXU0hsVY)U?NSR
za$rIrBQcQON8FTgVMZe#I9s1z*Qz!a3K#7j7#hZGgaJtbWemH+=XWN}17tZK8cVu}
zjtLX6+>M^;rza)tM<!tH7)j~K=Han3XK*iRzBnKdkZ=gy6P}}F4U(iw7#Io#`$5$E
zVN8TsIB6Of93Be=lkR@$T{TQxAo7@Ws{QOA9T*7;Pg84zQGT;Truly16qT`O5sgn;
zpuJxJLkTANV2A_~7-8s=3^7^iD~5A5q(ChWpi1a7B>#bU|FS99x|d%zm>o~@OWxwR
zw<+pvig{b6`DHg(P;z<ljmfFKiQK|?ZgVuZIhNZxwR>4-aMUI$>fR~3Ry6y<?74ZT
z*t9oRu`gb{Z`zV@6~tZssLQ|TYP_FUa(U#9k#CR1T{WVsCXrVZ&ufn6HO~g#J%9at
zyk%dsWnV0Bf84eIwXV-TE$6(xk2xdy@rjAcDZlT^zwCU&Df$lo-1Wq=jmjS^=W!+b
z`Ol#J<<x#YeOhV!o~!0T!nObNC1(LCgM0ZUcbQnxIo~zEPAuOZbMLr0AlmnQLF(aN
z{@0-^c=?z49vA;ly*ul<t0moS+@I%nySN1h-)%Q6WP2%J=|S<rdcHf`u&|*C`CFBI
zcZ=axm4WhgRQ*<cS+`Yx+oVIuZ3|C%tDf?99xdF?<|*&;b~oy8SM%L<mfJNZ$~RIA
zx7(~e4*l)T&K`^Yj>U-l9fuxmrU}aQbs5n;i^(bxT@V};uDn1fxJ-scnVe1PK}hxI
z6hT_8AJKu3^6GR}2%k(y4Iq??*sIo)TV{kbgWxUSpERn%_PAmgQw1&6xHV34FT12w
z1GaKt%+%+A{)}QilezJvDPrp3PJSJNnmJ<5Sj!-j;0S*n=E)HMdch+gjWXn<C1QEW
zIj#`?fGNUbyv*NI2=L4NxWZ;47NwpQV&j))4b&UK9I-;dP?%xFItb$)zL`RJ<<U{u
zqw=kEGLt&W8K_RV3M=R2?+h8nLhtZBUBLRL?nah8eo9;Nch8DsJ?6V-WnxXrceiQ2
zyCPOU`fEpQ8NZo+=;1GIkJvN9rhhe?=BwG{@ACiL*ZR%B)JATafBi>bxBnLZ{ssQo
z!FGM}_ktLZKk3lCgPmcXBjUifQ!&}Wn6KkShsu1x{2z}s#Qd26lFs}Y<IWCOkkSI(
zL=qphocYuxAMvRc;VbB9Z_*52M0UZXfpIUg1(W)sF!H)^UR{ct`%X=a`>=lI8y)lQ
z>j@WjO^lB<OAiQWp3vdDt`kPlPSO?#h6bSzr`Aplr2B-|s=OTRT2l{g`pAea^_f<Y
zWi}ZuRqLcg4wdWr>caXu$N@Pkn7Ke)Qur-OXi6px!;nY>(w`*jXf@@CPcuF)kQ^^O
zK}irv(r{r6(8SCA*^=ze02CfB3^6EL))hu53k$tGX2~2i4^6*c7`T{pq!mGGki>rZ
z4U^{7ILdcWOZqMXF^dpQKPDn5iDVo&jq-4*Mo4&AOnH&&H$voR!oqz|{^hN2Y@M<s
za&qH2{%DRrmeV+8TGrKDEAN+9z14TMZ+6pc!`xx9z9&|?E1tg#vV+|lx7S4NHH-GT
zL~YAEBiBa0KQ`6#VP4Uj?Qa|2K6;~e=0w!DCR)69uIHzFf3$c0*}J+}`+->A!Kpoo
zvYL-Mi^D&imGG2a-uA|}nc5gu4Ekf9Es6TI?`B`mo*R$VZxOvUiTrvozip|kVfMNC
zR&n!wasOAv#(`MbDY4+xQgxkJzd2UjF?}eJUprg<ZsYaFc*Cw}!>)VzyAtbnUNI~d
ztW6ZxN4@pSYdKHh<>oh<zug+QS48a<%iTPl54oeJ@tp(L4kSFq(+yV+i>{{oC5?%i
zZS!9jw;dL%p7_Y9&vP#uxtg|5I8#mbuQ*eA_SE6!Y|c><w>L%YO^f!Hgnv`qzcuRL
z8uM?T+Ot$v`F8sa{f(z*ZPBXsxiddK|D*Fa{dbSVHarn4dvfY<!q*!2t&95B&Gp25
zn?-wR!s!#8^-Fn`V%70j-ZP@>nWd6)(YGd6vUcjweP`KB^*fE%8sn8)qm^6lIkzU7
zJEjebu7>*_AC%-3FLj9L3U>3KFCXMNN9AYB&FJlC%T36C{;8RB6_O0qFUe5S8{Q3x
zM~{g|o)XKSj=7JEC%+=vzrv)ce*OyxW180Q*(-h>`Yw>><<h-t`I-DZYq+2Cd+H7I
zU2BlN)zIa_pW7WC+`Qx9_cWUBWE&~(@uB?AI(|>H;ZFO`V*GgDNkH#c@_SlM?^hAf
z`}I7PH}aHkX8Bf@Ut`^yqkq4{z1Ob4Yd0c)H%GtM%iZ;Q_qOWq*7JKCEqDDU%D3uK
zxA!{FCafZAk@^pUD2ZBRF;hgX42FRSe+Cwz8;Z+<!Z=e*IG`uN<tPV&Zf4}v5H27~
zDA@?euLaB3fs~U+i|{po_A)gGt{OJ79|rqR4U7+-m8~=u8J6`p-8^Gt@L`u`0<)5L
z(P*d%NlL)y@{8knwb8uVS<6iL=5{f!HkNlZ?m8+y^>oyET(le)T}K~;NH%-9pql>!
zzS8hrOSLM9(io6{#{|(o0V(($?su|&$M!pRX_Q{eXg-N(HFKV6=Be@dMwV(&3FuzS
zf;gp*=w9GMc|3=<=sT>qGTHyMOb}uc-@|=NKd3tcJM&3U<w-qS${>`g>){aoawGaT
zbgvf}xJd)-5QY$HALY)#a-a$>vM}=v+iSLV?iHASv~L10Dfn{@n<h;<E@H~$eiBeb
zl5f}pSyNe4wkdAPe%gSgBKxG7)glAWiYsE!ybY`-lX^g!)xM+Gb_3pYQcp(tA^xB7
zz(J{JvP}VED}>>0)U}Q)R*r~u9Cl3UlEps34LeD`T&n(!SY?q3Ys)ohZ78-4xebiv
z2F*9MMyy)<0P62DkOdh3$u(ZV0$ch>MvOFLAQ0t{*h}wrk!H}Jru`a0Nj|N7v--dk
zRfN&5g;QIS{gur>Tewr2e<P4ohRA(Ho>L)TkolLvv;eyuv)XG+6hd$!6m01Y=RU>U
z(Nq=;QKQ2b&S4fkwY0;>=J78{$4WCdlJfLzvYgE!^LvKWtT8Zr;?hUqHGL*iWQ2Q-
ze@!R*dEi@1wNl@Dr9T12W<{%v7PZmX;h!}%e%#j{IewQkqbJb9E@)FFOd3R-Bns9q
zk6=FyTFN*K&k~Xrgo{X$HjPPAGGtgoLAa5eMI#{^BHv56B$Gu!TGN^q!<$x;Hi<a4
zY#APdtvs}?<xw^N4W1Ap1L|jt1}2KDf5qu@@?c)h$xBq!#4GkjEA}P|d^62+#h>VP
zm3hD7bR~Je(&IJ*{FnegTh^iQvt=s%j1{Ym{5nK@;uUjO9{&x#)AUU}GXE^Ui`V}l
zzt!|ddStHKQS@j0cGI7mkoi|UivBf^+yZav@|YLQd{>rz!D6PolbT892*L3QVHA!u
zDTl$(v2a08idFdF_cS&T@SSF+EC{RyX|QSPV&RC@e2@j9(--mej*SNWj$|GQfn&qZ
z2Q^kF2$V_V1z66;Rk;<`siBbiMd54(7ak%@0@;d_)}!)wOPbCMz$sIZ))K1Nld(8~
z^(#r#b)-JDj2t1xvyyuJPC8k$%2VKd!aiL99SX7M2)|8FWWq3Bhm;D2NW!aB{7;dD
z97w*ZNU%G0?2v@mNfd|kG9$`QsNNVD*cTEj%;L(c;$@qoWt-<)V`cl}1^cHQOBP2W
zyK3gp%yw~Y_szridIa(KiTLqT(c`D$$A#!|LF^8R_VG{kI&0Q)7T4JR^P*!j>*mJe
z8+)T0d+&xm*m(30)`>;OrkqIr)>)SD<WB9o@2i~3`qaebSAKhB%9iky{ff)8ZvTjq
zzqc3NFYsS6#|!+?0{?79te|OX->(b?N8U0=Nj6v7cxBI9y;pk^o%?^Db6~DJ>TZ}_
z_kp|hUe1AKy{<Gn(LeYR{RPhEXHV@xr-~~-M&0exCR!*t{r2FZry=1ji+gLL-kO=y
zA9$OWa?58-H>@Azu3hpLiY4uHPtWZYi?)8?-L`B+#b4E+W2}qIZE&c7!^Sd1#KHso
z7a!ZX;-~m!7w$j!xP)^b<k5wENQ=cN!K6^?QBJP>>(K9F;D0-JS1$iuzNg9X<{IP{
z9C<yhhJ|VarS%0UxyA84?WSA2p7Msap6&Wu?arPJS-16B$lrGGJ)Nf8*`3JW$#PLz
zWCP@#8op<%;ZCiY@~tLHH<;+|R-W?PO}pIY_l*25i~T*5neq+`$`x4;9iz2pNt*c(
znUt)@3xzP)WR&-0PN;C%lq7@Izl`gRf<1FNgU|GYFD>;vswcEg0OOI;c0|W${t?i7
zC*y&-aO)9?7-UkJNp~l8AN)?X#<#$!S|I&U(rU?A&1Q2-E@gQ(LDNK1;TwPpS7;_<
zW*YPhfQ3jkWz+H(wxUE~X}qv4TG%#M9xLpMd%8q>*L|BaZmYRxt4VnB<DTZIr&+W&
z-!H3-m#vSMt)B~!#uVT1WOT!mv9craf+JIoM9tbM!=eS=XC<PgWZB7icfwel#T6dq
zAB0GEe>uOajlarwH5vY(%Yf`c8Q;}nSSZh?d<%~>4Nu5X3%J660?`!fU7FQvKI3Xv
zYW(pv_)K!FP?WiRH8WetrFwJ1MU0HKI@S2dbC>k0w3@kf8D|29^F8>8wGXwYk#|>b
z0navlPmyTp*_X_IOSlStghS*KsK`~oF}8rsR(V43j%W$HkDec5Zulxt*xBI=j$9aL
zE2gyGy?bcKPA3=6?NI8EkB#|;2ZS?0Uwzo@8$3H8g#5?gw?@22XhQ<ahx8~oS1{j+
zZ&IOtI5;XJDv2aXyFgyQSb%5zhNeIGh{Qf#$B%Ry$V1HVe*;M9WhC&F$S=CG>8;MI
zow5A7Df@kAe%x7p&sje6LcDHcv~FX(Zfmq|>tfyZC3}wOt(}R?jKUV;?pd_&N_YxB
zv}I4dfC^D(dCcaU*?iB|1h|B|dgi&AUUBW7ztP{_8$bA5^x$)`y(h&zUlG3&6kVsm
zcpTYKvb}}(ogQgjmR>-<NV<H5aP$^35-n5lRMua}H#n320y?E_E7c}>JV4t>-BGBX
zDsMhUmd_|}@~g<3yhd8rh5bh}Ys->=4pB$AgoVH}LxZ4EI!RE$0C3k0lBG?NL7C{V
z!c93ZvlyFBveJY~S(y1h@rV!!M2uv8m{*}NcD*$la-}t!(XbuS!W~!wyV5*Ma%B<m
zXm2*;N-J_mAXi$!Jas4}xe|F+%o5hfuRnPb&v-eftDOHf-(@g;M~~d){H`qhpYUBK
z)4O`)er!kCU-DfR)4w($w_t)Osb8@0l+QACm6#V?e3!?*kYlENff?n42DB<)iZZ_q
z%KS={0SQ3q%1b69lLpl-2js|*uIOPI*ci}bv6zsOT@i&`KpkCAYcp7f%B-5NL^=ag
zjWi0akc*l&xn=cl#1b*U+>k<7QW%eNuWvMPmkeNkWw5D}WrJPns?%v5?Ca|$vEq`+
zNdPM`=7<rkntnj43NB0n14Cf8Izl${km*^JO<G^X=B-PB3>d>$znWA^Uw=Wmdy!Yy
zwUlQn>q%1Ul>VbU^T*0F$u!L_JhN^x3-3u*sTEh|ZyizAgvhx7EoQxl4QZF)`b0T(
zoq-7!rf|=fovx{EUGS569@_}goMT$T#oc7mhIvfo4@@5?Ra>CpA_F?E<?X#fG5-1;
zDiaVG(KiYM*jbaT?Z;jQVk?TSAvwvA-<(FZOcwQ{BZKgRSK**`NbBnMW0Dh&<Qs23
zd{oNh_J_`nO$?K99W<yv<*6gk@?Wwb{T|bPp(%|COf^b+;81WzeG<Flw`C$&!XHp`
zwvmAs*kgu*p`=ZEULZI;a0%`T((5JdpiCrPu`V+^e^L+Ck$K50T9VA=h(Ly$wQ^ZT
zBBvc8_>FU+JxCbAgWFa?v4-_QYZ6_Jvj=CliP;^Cmd^Wm`OtIn3a4xz=9gSK5zF^~
z%;j72pq=RQ9C?Wvf4t_2Xw4G|Z^@OB*%Kg*wQi6`pL^Q=5m=iqQCuD`?uZt5Bnql$
zhUX3epd{~OPM4dvtjFzT8`^?x-sN3xMWxR_&E|3|-mVip4dgITktnT*mu`%fZcKP{
zr!UUfum;eH7Ru-m1@4b1fi9L?v|K<f<a0SCSAHw%^8KFeizN><C%J`=XlcjeTCh_K
zwzL*X&`-Rg%NuvqM_u)^1@9JLFP<A*bagDba>28|ShnK+uS4I#H+XqNPbvQ|^19k|
z3r>ihrUh34<?Br-W&)^gq0QM-WL(%@u(R2CE1%z4WVuyfq<ksC+^S;vdL!kV?SQ<s
zxuCnwcsqyh_F8Vcjg-$P$lIkXUrCU+>j?7px{{t;;~gj6y_0K1$(<rS@`EYLiS9`|
z0)Z_5KN2Szx}*t1?myBpnQuTPGS3eUNM3sIzf|RkYZwXPO(ZMChoVOlmvD`Cc0G~?
zHPEaYK+E#1(pU%}4yb}ePqeV-ze<o0{#!gHjqfX>;;6#+$uV~r25{AUySfShw>mD9
zx}v&kgZnFncNq4KP#VA;)6Mm8rRFoa1D=K>8N5x%(6izKC&s|h#bAs`jRDh}2KajD
z1pgyz>CPx_<fnBJ?93pKPfh<UtbbOfR%K~b8x4$YTyZ~yw}|5F!8*edS;&@qm@X4(
zTC$@D4r0TBY)aGNux76q>eaR}+KS0uEyb8RzlZm^;Zh9hvioDoG(mnVnH&=XIn39@
z`v`de<AIS*(F5>&9a<r7yW*1H7z;0!OePcgK2rqtFgd{;-tnd9;YvXv<wc+J1}xb*
zF*H2x8%b@8mi%gEE9nCrOryHqu<7hjGk7C*Gg`2I-cOs~k`}p&q&a3o*nmn%a>2-0
zAehWnP5ES$47(qeNW%H@B7wYEPmmqH6A$>4;nJfpgpvRQIs;PRYxbRn*I~$aK6nWr
zVW+&0+qeJd;a&(eKgOW`l8`#=AcsX+&j`WTZe%rw{s?#BKfs(2ssJeU+u45#0}$v}
z-iD+f;WCn>F)%T5AtVTtH_&s15ZyaOzp=PTE{U)O<6R5-&%yz7IM~muvdnF=Uy@b=
zfW-zvQbJT~zGQ@D{UGUtbzS%=<%W=iXuc~Fhon_sLs59mm!gPTnWG(VtjZjpSU9UU
zUE^k^pt`81Zq^d>teLVfF{Eksx!K<N%K2yJ_lwzk7A<?BEf<wtc_Cij8ZB=X3)-NW
zT^WBXd^J2<A1hxc7PO<8D<z`4Hc{5{k=2-!HD&xLo3j@t>KbQ{z1w%aZ@zTi8Ef7v
z*6y3yCAur4_9|7O7uyfqJ#=@w*mpv7KeuQ<iOmzDtNBJ?Zv9U?e$?@&TVgFc#O5wB
zd*`C18{M0B&KPIT!NFm!BI;`w%h!w98x}1a?-y3b3;oeTKOT7U`pMbD^IOG+ed3c(
zi-rDJ;qkcV_>|?o%@enkM{VUZ>+acV6LweJ?vL92v-NWaZ`Lo`;f#=f-{Oi}Dx#K(
zMN3t}ng6ZH*CxODb<t8rwy$Sk^dge-a<{){J%78A?^$QK-PC2lk2JPm0}Q4-|H&vu
zpS-$N`vEz;%Opnd=rsFO=?=EWDZ7v5DL={&5j#n#O|+wf5mz`7rn3MIgpqu?RR=`v
zexHCz%a~}jQzlN2tYKA^&$PN(a3o6+w#<b3k^`!uvNaQGQ*&BRQty%0CSq#HZGQQ;
zdzQQ8ko~0n+2Pu~Y$nnkcQT@p;}V;R*c?LMOhidYG+|U=5MN5U@Ub|2UUHVD&qi?#
z*kYZ~gx^xqKsoppat|z9h6hGY1qQZ-*J~%`BdCD7z9v^YK@*c6^b$8$`4Y#>P~l4I
z+{%8Z(_?|wJT<FWGSTvdVDF<vR9K~%0)tQ>M4mtw|0QZ9%@d>Nu?KlH>{b9$+f@K@
zoFEKD)5DGwoHS;=Sc0s<O<^r1j4oDEjyYl(C89<Yi|JU5iY4uAu=@kxCPTy0!X%M0
ziHiLNVAHp{JYv9}qTvw%4S#Bj-Mab1&Yd?m-F<qo^O)#b{~hxc%S`R{hL~&pqHCkr
z_Z(CjM<Emvhg<Y+n2XGf-rRXJa&uI4KecFonh~0&*=J_=i|&n!_D$?}&D&>Y&(1q;
zUW(N|Db^ej-A5Pg$0U;U_V|rGb9?89?z&@52V-@I#M)lbefR_W6Q40>XoGb#;1cfk
zx##A3Z&uzpe)k#i_(`#UG`4F@?71Miev8=`Q@xR&`*ZsytP5E;KM295!M)to*|m*Z
z*tTwGyZ+WX9%&l=AhD9s58`OpPQzys31BQzC`p>QNv4~W!3mxhD&5eLXr`qK5KVOF
zH{#>vXrN^3La>TcB)QEBZVeRnf{^W+?HMs^#XRy9fCand3CR@T3r!4?N#OLvu&N<2
zok8nQ*uqvR!$pMs(!wi@88Z8pd;{{1OFINQd`D!%Gx;Zmt;`AX%-A@xJ+jOauJlQE
z1>Y(72!%pJXGW#X3aUUt-Ug(pD18A*fPs4r2Al<3V7LyuIAhyHiX{xch#Yn$q^4N^
zg@H@7hMY8!<p6>U&1Z>kOX&X3@jG3Od8CQt3?cjrfG33KO6udqjnU%9*?n`7SaFYN
zDOk!W5lfqABe9$<QzphC8)i4m){EKe7A@`fZ8_7=-Lq9N1a6q!GTSn5y;*y+Ky>d1
zSNnynfMIO$mEBi1iB-F9j@;}QkExb$?D)!?a!7`7dIR}Vw40Yul3LV*89Ts-vpDYj
za~KnBv{6|b7!z0$bQ3}iqZTPt5}#=iN403eCTL1`-?(Ik#nH&*T}!yRCx{S4BM9;0
z8#?Vv8H*%3rTN}u+8GK4T7*AGuXl%YQ<kT6D*7P1i7-vLMB?SpsPBOx)Y8(@dkiSR
zh#Xs|H-?6T!3!xQNE#(^?vK%`FiQy&+^!?{&}aWc6o!e>kRcBtYFg4wS*f0f>5K0J
zC{tXqHw3%*&d+qcF~%0?3fMQUnHiq>%G|b_jW<j02E^>6i<V<c*}2~ud2Qs%fmn8Z
z+)^)E>Jv^62%y!U@;GbX#{W6L#qd+pHhxh1IZ3E|h1eSrVR?=A9P%r#Oy+9Z3=rVY
zgRX=uw3ZRjX^=p#p$tql#f~OI1rtLB^Y_fMd;tDWNX4#9aX`{g!LkAstO_b*g&WdP
zf$acgpC<zz41J1mP9cNiXiz}>n-tDG$WBKJ;eB*WxQhgcU}Taw<DDu>2tUKk)IK8N
zuL(K>I<PtqZ6gx?2;k|gFU|I;+Bd&JcrgrU887lnE|0!38qaHs=C#2jXv@3exo0bx
zG0%3+=Um@@&(}dKVdQgBeC5EEt+UyT0rrYVzak##7yAcAdw{uGfFn8c9*H^<TXJ`m
z@C#nPtH`jBi*=85OBNv$V@vmu(JtN+E5hf-l6gAQQ0Kksya*RNES(`Phh0NCG>qm_
z7LX_7z8YB|UQt)EV?evk3c#sv#eHQ53A=9%WMLB^?ZBbwu;P-RK#+c0c=N$Ajq#k!
zyA)Y1B}+0}dgwxM5V3m(vCnuscxFr(3Nv}LC0wXF$TPFB%FUSkmejYeT|2QCkN5fh
z{cry_z8<)(YvsP7P-r3ueRuF|aPYiZSGx$T$bC|P8Q}yPn`l;A><x}z923qfRI-`L
zy(0sch$T|YG~!#qKvKWHt!<)Csg^cBq&o0y3JRkL7{@v#nG7&H7@4d>#iVg~>>@Vd
zTPavkkVQALGJhy?y8<9_Q0zQN@n&#I;RcnMaTiO6f)K^8m15#MC`;dV`>?V9do)dk
z0LXURi!T3c<80~Nsd>-5QOw@9XxaXuJ9m2U+x1iCgv~X*Cu%Du?&yB*1N+H@BkxMx
zTg_LSzuOvh_*rq+2lkx_hkN==)KSU`IzO;)`FnfGeS2=)ULLiVe_*eWIAlt+!h<!@
z-u?<=78BH1ae6|oBmti6Q~0Y({berA_-#o2HqzfrOUE)!X0{?`a^!^-&xGaa%-dWQ
zQv3oxX%J{d4lb``!+Qk0GJ61T1U%+uz_JRw;^Yc=6W}2t2CS>VXUVJq@Mgec{syvE
zfmik&0p0?53*c?5z}q$LTLEtcynPjThXy_i@L7O&tOB2{fwuwP2Kek%;GG(HJK*hr
zcdi2O(!e_a?*P1O6?i46B*rHj@Y#URSq0v$Y2OKWC*a+yz<V_CF2K70?^y-jtAWn}
zd=B8ftH9@K;N5_C13q^Z_&g1~2k;)i=dA*tuYvap`4O++ig;I>cL*O>fHw12X|qt%
zW-j^wH~2u|D)2=b_&mVp0lsJz_+kxwKH&2KU%U!@i3Yv^@YMg3Rp3iC@P&Xc1bpc#
z@MRkKBES~`zHAlvat(Yj;EMrYz6!ig178C862SXbfv?cOmjb>N@D;1TS8CwP0AB|9
zN(Qfo@>&&M)18WvC^Ie9G!9F2a8wuqUk)&aDly*{_};PzfBh4}aMGS))BWQJHj>N&
z8xFumjD7FelLmjQRNhKj08BI^q+t9U1XzeulAz>oDM=zpx>S>TDu$qOd}w?)C|sbs
zhVg+jp`;}xd|)LzB*g+qT86Q5KLKe4`{gIb;UP{M>d3&*Xwn)Q8V|CK@yQ&r|DgT;
zvj{#oAPk<plysyTfc56W_}Qcrn+utFyZ;p2!_ULTm<onQ&~PYer99$oqBsYJBZ^eW
zEdN0~FOakiVwGSx)s6#kbjE2-fZ`kmddV*v0a#BB4G)c9>JJUVfj#LS9HWS}a9Se=
z0;$YOMtkVk)Dt0y4S+)s!7fRix1EA>!r<A|4^$pO{2%n_Y|;xA`;0Jv0tz}HkAn*V
zamNG}kTli0LkK=U6uc-07I4UR0xWF|j6iN7+e^}_MDP>V(MKUki5Us}<r<4VfeN%3
zEi6$&-$wYil>9qN{s&6#Q}PQ+{yimsPsxXr{Ew9UPn7)6l>7%ueo4uHq~w30<bS1v
zT;_!Tos$29l4VLhqU2*rKB44OO8yg)P&pFG4)MrTGEmF|kl9@nO*MTf<cB0={TYOQ
zia3Mtg4Iz^^^^q$isGu7EzzR3L`n6`SE42DiK0sBxBR!TVx}=#*b*<?6fN8oE9^-4
z>fdo*bH;t^qrUYYIm|U#*yQNta!W5CeB<Cue$49^ZT_kCND^gLQ@f`(zIGUGzSVTK
zX=XB3g!1)Mok$YZh?X$Dm9`PW$)V)(mN&M{m|~tf(N;Irjs$)SxWD1G-b8-+<;WY6
znf<Z+R?*gqh?ln3M1>zWJEHcoL|)nD;Wvh7HplXsMO*XKMkEPe9qw+9Vqf5@b@5=-
ze(sIuX6j?PjiRk_Y6Fr)c@1iBirPyOc&AnF7Wm$>U$xJih!w06ZEL1BBS};?qHZUI
zOtf9$f5(2!E;jFo`MN|K{x3nAXy}~UEqZFB*zj3W{no*&2WQJ;C8)c3YAcdN?K(8D
z9g8Z7vf8(XuMUfiTViFnvvq1al0^MRs$Gp8qlv<bw@R*-%nZj0*NL`uQyoYWRn4fq
zC2IF!`^JA|=T`k>nY#YB-A~Mn#A~-kYqu`eZWo{KOTEaK83_zk$+Z%(WoN9STeRW-
zQlyE-t@N^WQF}ew!0SGGv>!WItG~_acdHuT*>Y`**tR=XwMVq!|8k^><}T_S)|?v9
zIbZ!-k*g80X<Muup9%jLBTe`>69~5V)@B+n&8J=!5$-#4Ws{z)uwW{4X8e1FY(Ufa
zCE0+O`yh%}UYV>wnSunUjtVRNS||1DQaxBK?Y9FZp$m)YncW0oTas<pY^l2nD@ckB
z3oA%lVChyA_lO|?#Y$-t%1J=a7UPX@vV(f_qTv!n7~_YHWWCDd1OZb687@pK*U~ig
zSvzn!R01xb7d4aSFWIg+-5|o+HNR*^zo72CXkOv^X8|c@*30K<YpWuCAVR>to|ax_
zR~q^bJ{(iR!!=Kh248>y0zTL&gO+6ae4cEYN@ZqmVD@z^LQ}LGVHydAydg6w3<0#D
zDJ}1uqTC=Qw7iq_g7vd#(f#9Nild#pk{u(kGn9}D&QyBIR>m43(^%4+vW{n3&HfAk
zX+iYl?qFjk7a|j!Wc<p?wibY<zjfm3iFoPSXzAK`X=k*wbN)cAbZ<O=@6_H;OE^!_
zmHL@|voFNlo1p7EJ#lA!)LB29Ki3*_?i4LMm&>_=eLN!B6o1T_tp!U(6*E;clXHPs
zQRmcwgtO?%;5}!>QhxE@VH=U%^R2_L9Tv;FZyvb0Rea)zc=T!U$Z@gcnMM1vOP>5M
zQY%0OnPHz1k31`u^ex&?5G<|t6#P0whMAZ7ZWI4%eV3cN!FRa~KQtisqjHpyU$L88
za9g|e`h{ZmPPcxc*+}JUi;=(Op!_Yj9d~b)74O`pzqOf_Y%`+dwqB3BX})F_JPT8d
z|Kx9gC0YxeI!Q4pi4d?0cDB@nluPJu01M9YB$Op(Sj@Q9CqI^&h`6xp5$%#EQl{rA
zkzXEqstHe3rn}raY!&23oFZ%RSIX?e4001O$ix8)SQ*2j0U|XTAW4}=!=Uk2B64Ds
z+f;gB)x@hYYB%=EZNsVo!X|CVMn5w6A7%0^x}o?=Ln|?d*U4H5t&%CzJ2l71MFtv(
zuSZ@2BL|$}7D<TBlAQDcaJ6Gvh2+}8LB?&vn6h7z0}2yyCs5|M3x2w_1_^dOro?-N
z2=vqG4J=eOh=e3Ck`S*r&?HOy2LgfqF&1cKU|1>dhxk7n2qg=Z7FVh_5+TZ`XID{j
zgc2e%{w&FmXhu+f>IW-C6lJWtVGnH5E}KKyFWTZS^^ue)X%K8F4J|l2F+$Nl*mfH7
z*1;~8EI_G(vLqRQj<RsMb`2*3H7p`(_1^;$Hb{5rl`}DSEyDigSI%sFr}J9pY<PZc
ztZG{<e>*m|(2lE?sHbK2V$8D<ZZ=-uO#VB?*NWj;yCvRvAliB0?txh6GqH+iW8S_g
zD}!%}df<sOzd7dFg#aNId)(3xwKU9bnmax}yl6RapQ3-YNAs`}9n0H^m4Sltw`^B!
zGy85_oV$3_dUtKCwKrC9c*^miGas%jOWyn|j+nO=0xGsoB5ns_b!bC(d}=efvX(iM
zHER_^=WpX>(+P`e<X2aLWTT}#0hFntgD;FqCX|Q<EW|buFLr^$I<%f5a%(F>Zu8-)
zU6S6(c15M!CNz7d=%kSrVEIP0Dxnkk9SX$BrC8ij+)e@e8xSvsa0bC)V3H0IkpezQ
zi11(VBb>GYFXMD*BUI=BEKngA-}Xk;jo=T?{Gch8yKyRu#oq=`xRMp~REhQ~coMLX
zAjM0bf^TnBqHI&o-pXp={@ByS(bi^8pGMt@5~6GTCuA;2{|FiBD%^?WftNo-M6+HC
zi*iP4tOjJ2YpEah5p|S3DPOvVvT7sO2$<iLTnDPj8<FA{A-)G~GD9%efNFq|C`gNB
zF`*qq%xv-?i+opFFAT%Pp_)+e>6u}L5rK5;3f6fUeIWuT>_&ouCn;|LE-)gQjs*V~
z?xj<M3}kN;p}+tjU*bN+4&t&a!|}3~Xj#i_Wd2C3Y)7o9D^Xa95HmCOxUVhhYnv;(
zSrYU0#!3#8OwtsuTpO)iJGUiPNuU{uK3XwB4S1A%k(&p@4Kg`ADgtZzHZ;Z)GhhIq
zl%T;3hT2|nJp`jnY8CJym`t2}<+E&ReL0uj&Ltk_nACR#0zR3&tV9lS4xsZG;131=
za})NZ5Hn(CvwnDn!6u~y!AcghdonjjU&RCCql%INEp&G1g3P{hSvd&B#2~^81m$80
zJmug)#-|jw^Dyw=nt(f+Z0>>^t%PpOa-=7mBg9MhjTbl+h3mB}Xf>|dL)dp3g9ZnZ
zY|iS4Tk4_~cy-Rz&2NDRCu1M=Q44lc%;EPA_PZ)-shZh43ue;Eepf~<l{1@WpIfwa
zWW4W-T6{AFvs*r}Y?63{76mEKP;fu`4HVR6_F9rBJj9_K@+*2A6qc#-G(1LmB0La)
zbP(Y1-gHHvQ>Bc)c>c-@aj;XRt3Fo)h2^gNRi10qJl8<ag==@_cTq%4wj{P%n~G42
zcS*I0sOZLU1))1bV8-b*2n>&ClBimk;Ss^(LK7n+1HvU{f&@up<c*yF8MTug7t)bV
zvRQgDI;_^ijtk($E1Z}fIiHRY4*n6I$8a#O^zw-}PQbXA>%W(~d-l0_^VVqd*7-BB
z=H0M`kg;#ilCS#hqqFVT`sQ+DzKv6Rr;o$_c0a%D^4H$@8mx2q&G+&T&XvU1bVb*6
z-So%S929Mb$Xa)3skY(9x;gLlj=77m+U=-#@*b>TaGNS=ik39Zo{W`rijK~y6G&9h
zuThkB2^0=9*;^zW){;OI`p$6p8NBqD!Qn~0(4t~VM6X62mhl5o5cG&XWJtwQ!q<Qe
zLm`){0)iMsP8Ng6Fv_2K95ySG6L88XWNX?}STS%&_vPjT7HYLED6APR=vQe$i`Qns
zsp*5V$gJS8@scqWcgS#&LmcBu!sry)UEw^TpmYWcI)zYRI9)+FEhva>(NI&y!KrRi
zkL8gSCioBunX;%a$#>a=-nA>KY-W})K=}P<Xo5NEd3|wDRn${8vpeQthG1Br8<)23
zxoh~Fz~a`Ub3H#V-#mNtZT(F5A6jDNo5g2O0QsIK6LEf3JijiQUpJc-%V&02n5Wk*
zRn^YC@cpfT=_6ZgUZoUbZ01rdkC}>r_G^|ZYi7=TzX>qU!d(2=cJA4IKy-Wi=O5cR
zUkCHDn04>0Go*=?g#QfZ{|1>aiSyZ7oR=vpzV>PqSc|g;U>rS{UFsb84RF>7j8j|C
zVm-szONL7ZP|jw;GnIo&;S<<W9lZXe#XE9Dm8s}2&>wYyhBm`9Y^y@C><h|>C&RIH
z;D?+5alGUTy@AN4+Lx4gKs(1mq;oTr!bi`oiRRYKoJCw{TDQR3LhDjR^~}@XFUCiI
zhSn}}D;^J1P#rI*j~3L=7RL(M;tAFY)+1`;to8f7Xy*ii3KC*$c$fkbe`VM}W}+{N
z4L;46$V36PheIhG_BW(*gfSVY=5K^C*&5sNLm2Z2c|}X*h)ya(th#|trgD#HL3t8r
zHPK161udO4G8w{j$plkR8DTB-QFd-6{P<IXrh=v)5}IaMI3#cV737h08(}9B9BT0-
z<yHKBR4W;1q>FGl&7qZWS?O2`l`j!0)7mvd<%(uW%MsTg+~zLPhX1jYwd=#i_2Py-
zf8$+j?EQ{G%&lE?)rrTR1~NKw#oT&q#=*i!sXxWW`(q_+6^oLk`qnu|tbQBNx1UzB
z${Hl?N^IQ`E2E_{TI=dsYG|4LdaMBw0otbJvcj6wuArt^At>lZTJqYsRO6p*h}En|
zThB%9mDnPkak|vc7JmQm>eGct5SuRlFB4BiC;JBzPjxaW2ns~j63;q9Lsg%__P=4c
zIc8ACe@Td?tXC^cn#d+ou9>OuVFH?7?I8jR?H~gIRr`~|x^EEHMIM87OHHj}TUV@U
zC*cKQS)!;mUepjRYM9*`D`E?&SYF<|RNFjzK33a-Z+?<iQx$nK9TD5-PR8m<lI*`{
zuOT{`I=_;TLB14)97hFzSvpz(>zLAp#^|EZ%rD7l6?jk_gHZU0Ru#&oX;u3CI(B{r
z$-?YX_i(Ww9~MOE#CBte*W;{=Zh7yOcCGFaby)k@ucedg_zmH9LbH^5>|>rEDMBZ0
z4Gj&P4*J+BdL%Gn!72of-NKwAdYM;*O!RutS;?wHq%>)zvwn85V}w&1l~mHFcvP%(
zJjEH%D;!UW(536{zefo7r+CC_WDXWT$NHtV^*<RDI}XG)9E`Ocnzo3AO;J}f2wY`L
zykbqXVvV?VcdSBM9>&@=B0K0E8<y5=_(@3YJQUm58(VXjDmCA8wIC9*eJ@X^^W~Pm
zZDnB^c*pugTRUqthF10X{RQk!n)@4YoD^#yh6Zqd!-Ejb$=}QGD&!Wp{H}G}LZO#V
z^l3$)F8#tf@6Ig!Eh~>SEohgb6#XSCe;K=@ssv^7PtD}`FDpwjDo&E2Sfz1_==jiC
zj2;+@4d@oTGCggD(O4I*&1f`M79xDoIzfx@cW4qcixDx#RLMg(sXxAJr{o1hNT#(K
zChe&e25C)!=CNW!<_WE;wK|4uLsp*KFV%jVkc$|#6d7xav<(P80(YG89Y>=(j>dO9
z8{P42thg_he`3l`hUGeh+?d&dBR@rZn`~I7vN-%jJhk`iwfOYbx(A^gwEAaRT{y^*
zE9@%4awCsa*>{E>a<mSD1z7%*|AO8t-T}1RgMSl&h$04|9LrY(x#Cip5PSfnQ-kC%
zLs)r7bZ4y0(|Dma-f!iVX;V<<kO&du4aMH`(38xnWTlDVW~Q(P%935G?+Bd)FRDq4
z=A<&k(HS9(teMV73YaymTCj6g36LZsFM<MPy~MxXqFD}9+?ywD%+Dgz+q+ke2OPn3
zA1;e1uFuMw%Lhx?H9fP#r$O06JL$xTmu6_oi7%Gw%cScO@2fd(B4WX5_Yc2sP9*1_
z?8ZbTcQbZHa>jkBEH_@M<Xm#@v|?Dso<o{h?20H(%Mn+<G8&_WDuiZ46<C>6XzN5=
zKQ#Ql?lPv^>mMOpm5#+f?v|n;WB1VSgG1%XPsJ)z?W7}MLAVb4WOgJwQ&@(8HDZH*
zNLKn05iE$4ZW2dCAi8o5LUgS-EMmM?e#UscoMW7`b<(YQUZZ?Z{Tr}Ha_~F{dun#X
z4et@f8pF7*W_;jFqMLNT=zjfc(qGk=WW`&0ap(nY3}IKm$=*dFsF4iEU9jzTu5j_u
zAbEu<ibyCGMFM23#jnG*k0JP6CcPp2K}12aZI7RY+5PO;aG+QC37$qk2ofk<N;*TV
zDI66(P7$d>%pXPCQOz7lh**Y8)IBq@H;D3VU)Uv|PbD?g;X`~vS|bX3_l>fpzm({}
zsIN~Taa`Ie?M%If66ZHxio!|0FiC6bNdv<;q?`4TonkI6L;I->M*0a=ncs{+jw_PO
z%qhwZQbJ3`QUu>_$}u^l8k9yTri2M2#z64Y#2M)rDvzXyRnko#66~Cj$4&C6siHd<
z(UdZ7@`h99WSY#vPek)&OWirLnn-Jx?A--6qO@izdF4<)lP(1;<uJfPQ6Pi`Tep|$
zodX~XZveKn@{&wtwdfc&n5+95r6IckN)qxRk$iT%o2^~^{lc<D{TdwNuokB_e3Zqx
z$`iE>lAquFSgf`;?(3a);G~GT!_zpBsx9hTbHBQt&Vz_oZ;n=Pj#ux9R_{pU730tb
zIs~GN|Af=iDG+)(1%g)B>fXLM`*pU+UDq2cI{YzL=O{<C-qQNnyjW=)j<=|8d8hYU
zZ^B#g_Qu%_b6am#!x0Z5tZLk%i#d<hh@K_{&sr+05G&Wk%G#%G%LYqMX~N%3(Wc`5
zZBhTWxPMR7zvr$k=06s%IyQaqQ#V)LIJ;%O@aDl-)sv!2in7%nEp8Xr@4ET*Sn=^`
z%l)$Yw??my&L02CnfcQ<&)gl4Z8#Pydup0u7DH}Z);V%pJ}j=8IscRHzsS9#7uWSH
z7VlbWUOU$rYu<ik@ArDKPp@U&Pu9(SEw-*Z*4%St@0-2Y9GYMLo$QYe^LWeU9IoOp
zj+!uGEIwZ@<Eo#6b5nlR$DApr^zXct_r1lJ55EEL*$s1Fn;Q|kkBY~Ri$|Xk3!cR;
zz}&q5gs@$uUo1NS{KcpBTxspwVX=5ED(ANRT|w=AxDYt5Iud2*&Rp~Si+9i8J&FDG
zbUwv%{bI>i(L`Yp1lWd_E0(viuVzz2xh-FO>g8Mr+Qs9;<D9UW@;T3(Q7qpOb8nnK
zD%y9jgDtvnOc+VvFY|l0@~;-}DdpbccU2l@+L6PS!(BDla@gg;k6ZrwT@5<K-`Z7g
zy6rYlK5rY!@8otFcbDkiD>CE9dll5odpOGi`5Kni^8kIX!MeN9_};qW-CpBgWt(vK
zue?T-{8gcz@+HnaMaI8stl5)meBWh6$@{rRl)PU=ci%6y?&;9KU+dhnUjP1jBjr2v
zc#0wn1N}J?HeaDd_-`Pi$VeHF5X&g*C_*i&r!Lhw>tPQ{;$g2FwVD<978VSlLm{5O
zCd#KF?CuGY1HDi69K?p^-LROeUVkPy1<@XA51uS9K{9f21_i=dBrBF6TUX9_sezAZ
z#_t5UG~-PMYax!JyL|qQ^YOgKXkKGHZ*4S>FgkC0+_inG3vpGTCg<$nKmU-t@OW$C
z-+Bs2EG_(Xs1?n;%y;SGAJ-1|xV7+(Yv+DM1wZE7xu00!1@W(R_{IDo7C1e!gY+Tj
zqQ7LvU?1czIwgG&2t9On#f5!%tM0J-|MEn)2(NgDkr2M(I%i)|fS-s8=9Eh_odKpE
zOreTA|DaRgaP}L-<wMMA*OJKx5dI>m?-4PP`z<>KE;A&F;`mB*;TR24sMw_*jX{e<
zSVk?D@2G!eCm==mO~vJ+*rW!8*!fLsT{2-}{X6`t#6KM2FkT`*3lpq_CfJu~5ySxE
zCXPpy&iuM$lBXm)G3;?~LA9Bhl;OlMvvgvZ%(h|rzy>0URG@~iNSzoa$x@@}eKK1H
zm-ZMjH(|f?(dTd-K_yA#U~9wz{j8*<ijrzdnEg0NIr0fkdErTQfD)WUTZSk%jwG3b
z<G1M0Pqmj)_h^A5X+`&>o`nd>RT+ax7fB;~$F#$DSjhumOlUn&EJbWMZ$aiGv)sS&
zky-bBt@nJrbL~Iv{849oU2k+<FOG#;`qJlU=^ZWU=V*z|+hU$=317oI+1Ikg*6lZQ
zV!rO_eM`laSj;YNj(VHnnxQ${iT1JNqLpPk=gociP^k(!Q|hy29~~(r+AGwfq;eA;
z?|pZHa;z3D=a_kGZl<H7u41TPF5Oj$qoaCCaCB5po?(8c4cXg<GD<5wxOaO!-&0_^
zy}?NNPM*rQQu!Sh-&16`lSAcq@~Hey0k}4Qr--E`)?K_F#|Pjznme@&ely>*#c-#?
z1eo_Y9(UivVFU*5J%e{wx&A%WEw;Q@Xrg?%9xw_eM<)>iI7P`xOn3}y)l-G^OG6>j
zj_$#3em=!SiFvaNbG#DAk7N75YDWS~r#i~ijj4S&a{Wb~x$onzs&X-v$q>%zro(C3
z&cIZNJ?SW_a1k>^`snOh=sy|&1lKdNNd)w#x@?+B=hF_Nr?P>G_!%n=(Tii|NCNo=
z%!>30Lv7>%CbS=LsR?7WZcDiHE;qi>7<X4i-BmGn4bG2)=~_D7Rd3y<b!Xo+pEIu)
zOSZ)A*k-l$i)AzJ|2nh*&4Ekj^RJfrxodo#;h!7)+#gZFJG`H}Zte2we_YVz)GuTi
zQMTYTqF}+RM?UQn6Y+nAq$hH9l$rHWjtw6lF6p9!gC)O!7Z8weU=%wI5v>Dft6XYf
z>Y|@#%2S9Kjx+|ztp5H1Km>*U{<PzH)nXrwhYdB@cp!f4l<jjS=e(>prU!1L!DZds
zfsEX}Oa`xqa82Px60Wfq!VwXVc%c`D#wFu6Rx@zKIq)JlFgkGo?rOY1-!vtgB`p*r
zfo&sY;S!*yB~7g8RJxp&w9?z6Rg8gGqn|0I)iea;RxP1KHs|zw>)dPSzBwGX6y38F
zr6R|8%lO~tOAMDyW$D`r6cLL~ZFtPYOtE)7O1Ux#4RGqqbmE(AHPowXy{c6Yc1Zoh
zG3Ve-L*JHNnM0i-B#{y+OP<VZchP#VeL_Tbfh6Q(69ZXE*`@3aN{fUQF|y-9jV~Hk
zOn!5?fQ7dt`Fk{YF^x};p}}5>5t7Hf*3u!l=4+sR%xaO^tAlN{$|;sO`&t5)T=UnW
zA&qgGBznobkcwGF0)ey>m2u}w^z#OimCI~698)^_QhidmM1w*P-EAdQ`dzdnp_0L9
zeVSLc=(I;m+odf!H@y^qrnECw+8@vFpW3^Whw#z}w773xh*j>4<#pr0Mo-@KMds<%
zKI@I;x5PZHqMg+Jg0J$QLkpHv%BQ7c6SvL>=AXW~_U7PCoSAqa<~~S=C)%H4s^!yA
zEjOV@FY`OC{HqOJwH!kGR~z1KM{c2t3Kyz*%GX+Vny}j8-pT84@kZotne@1;D0pZ?
zRq$@&hX&b+<gB<>QQSz^$TSrc4x~1f(bTON=pLaGt_4Rk1AWP#iCvFW3%!b3sD5Fl
z7#dYOn6MphCy=t2rW!J>kPJ~7RKsMBqzY<8y)?Xe=<X)Mn`hCOf;WYU%G!A4=4d6I
z9aXtMUb27ckfKJ?sphHO4JUyuaaXsbMjE-&1N>(RS9b<gl6W4NR2l!Ox68?0;k#^x
zt4+u)82K)TVZmged=>#L*m%l2Sn9NP73&uYbW~o%Q@&V_d>Z3YNZ@{aRfRLKkxx%1
z`NwFPSlNQ3NJcXNOuwt08;-b1nQ%qsMND(DruT+^$@eD>=|?eUI>jNACaKXH4Vn7A
z%Gu$dc8@<h9E;Qz=#2R|HZjAphf0vuv%qB{4m1B+oX(9fhM5jrl;1m(#)#Q-JvD<0
z<PpOR@<J<Bv^Fq+v||?|Rz~`9K7~s9q31pR*{kV!rf~T|oP+Ee7#{WwJdcQ(1E+AD
zqB>LI+WQrBFvUHHs6Wuy$>|7XEik0X>_@A6k5ux$g=X0?%aZg-OC++Umr2QUsoi7o
z7bJ5&0_2gL#!i}MhbLrI@?6wq4b2FJi#5z<<;^al8RSSO(F|<)e}w9nZLLiFW~U|J
zZ)g(jC0|b0EA-KU1RJM~iDKVdo3C!3c{*0y1oQE9J2q$~yw!1UW7OMtqkGQqgMA-(
zH!K?g3?r$x`eBu>SW@YV(oP26FSED-m`lsMV(y)HdC|U)@wWXL&jTi&{&Hzg6_mQ}
z8Yp$$6*v!gEwZ;7OOf8TcyRA_G2dNfx?N(Vd<9SCRXpWutUWsY?G|VER{ia*M&$44
z^gTxIj?vrW)88qCnrFFFWTL!J5BM}fNSgaAB*D+(vuM~OidSA48DIv&r<tf}irXao
zpeJ=1B|%c%l-=YqIe?jJ5ClhiewX42gAJ^@Ogq3;BN}8!MfOwQgl+gtF>?7ikFA5F
zYh*K*T;~z3D;|IW%bQAHLDqsGYto5xuY$?D<^C`dWz-yDZ%vQs%A`|xgg+#mW+9l}
zs$@n|N2H*=aPiVO$71982%ayk*0BwvY}=J0UqVG?rAmRY3z&hUSPoMyCRi}TQVacL
zQmdbGjOJ8Pj;*jgB)>ALmDQ#bQ<7FjTxiKFvlLsnl60g35C;Qkeix5~dX^~7zd?6W
z(n+?pccoOjIa<0oR@xcQ@5B-8>();lSSpmF2wQKijn(ds74D&v)!oy^rINZ?W2~fQ
z+L~|`$6b|CSLKIg6*K;Kny)p_8RkyKDmTZ<I+lD@GyC2-bnVbw?R;gddTY$LEm7C@
z&g8X8c$d|6e`Gdbu|{vo!6E2q6)QmAa?xIfvsMbWeEunpU194jy)xw(oQGK49dq~G
z#s0!WjB@lsD&CAY!sc@~|7zXNwcHQ*oo$92JN3xkYNgU!Z9L`ITDzV4Tb<7CEdA{)
zBl5SMdfZJDi%HOA^S<dHZQchEHgbr+p%r!YX-8CLp8E)zr`d#!-q58v-x=&nO9M1M
z9?A@pXQgynHJy#j^udnQ9tEtdJfs;KR6zvsA}DHvIX!Ab!~pRCp(S55sNw-L16aa!
zdx8>&A3Tfb+K5ArlOYFuO7KY8YTLq=Zm;u6GXfvMpb^r{yl|zuIt~LXB10-I$<@;}
zN0S60ZIV#uUM0p#QXthCmvWC|3qdsPV2YyFrHMxLnptWkBdv$5yYdtJrDvo?YRqu|
zJk6~cw3C`!ChMR&w_2m6t?^RQ8|O#vo)EV_E0(s$O8esZeN%fs+_3Y`#=D!ur@kV7
z^;E2TFt#D^pY=HCEz!L8JBII^n8}Uh)_vfr|Cq{_!J)IU$W(BGfABFo4NlP@2c=1}
zBBn$6GcotGV*e@8eu_<(K};7(f!OKgUv2DK!@bLQH5lefkXx`9<AlqFIvwTxJOCCN
zc*-{!DP3dTnWJCmaPPG1Z`qB=-^$SgCT;#$@&0W7EF<%e!#5-R4dpNvMaY#cC>iID
z#!>=Yeb|;F&kH5?in8#;tRs4r^N~#jb3i(2KwSXRGZ9(;qJG63FooC2Zg(K$L*qDv
zi|xf=F2(TYr0tcd`23pXOIX8*wMf$->{n+%%6pD1gHl^8vcHU$sfl3GEPTRz#v+tS
z%NvXVF;=8bg4BjgWfDl(PwF~hzl8iQ*=tXJZkq7A^5z7gJ=t9pw9i-UBvL37Iv#8O
zyja>1E8QQ@-wz{+C;v^`+k0mB&JEpk$Etf`1-oLN-J*RrA@+gP>Z#tEk45%`8&Oc^
zx8Bv=U3a%ebUgvr22b{VPaX-Mh&_Un5c6fDNY@7bRezU<`yt<zWB8Lw<S6XO27Vz2
zhZ=GV9&6V+{X&Vmt3|)iVx;^!J?>`4-VguLsQ+V(Cm6StS0?w)OyNPuI~jaMq4p1(
zP}F&#at9T+DJ<)w=LYPJikzsaqkjZf!oIgN+@S6xaV5>Uu<CQwnAh^`lep5Pi99Yf
z;Y1WqFht@uy(w|5%TQv6Qe4Z(xRw%Jgw0s<I2nD}1%5>{))GmJNfa?-#%78|WDTz)
zu0>(_gy7lWXlMvQiIf>e5ripvp0uF~2Tee@92yKkR%8?C5U@m*8X+ORh%UgGNo+-0
z0Td1cBwVddX<}+htHdCcXGsQ8yE>aCCoF0};%+KWV{@7@yQ_Gh<fp~7+0^D2);Ur)
zl1_<rsmJ}1SR*`v1i?XAH)TgDW;7+~hv)!Z5-rG0V{~%Q(>BRug!np9g)h*YB4`Hr
zL`4mS0*O~_h*oTfS8R_~Y`<xXRUC{LADlXvko}@IM5{N%t2?9Boi|U4$NI&duZq>3
zvFd?%*}&A{rSht`5B$VDZ@)PtK6y0Ob}Ux?RIL1IsJLK*Weqp#=2~xVzI!Ux@MNs?
z$bUBKOSA8L3qOTVMy|?7K{QIUrw%Q1_=7W^OPiO<D`&RG%GV@{>L891k2QeDI=PZV
zu)viKJowlE$j{&uB?+TJiO=r3c^(}+a!h>c8S&V&VtHT8eL@@vAPhO<vqA9L=kWdz
zOWWY{(d~fKN4LT7!&c-LN)RZ?uu$5G{H=oGZj0g8Iv4V{^#pv|z*FADQj3xD4r_O_
z{&t?byIz00-bndoJs_3+jrg8iHvTcryA868%z2?%BJ{B^2V)(<thf*WAyxVi?V#h@
zQu?5_5+aOc43H%2w(OWz+BKnrCpG3^CPN+_>W1LxbbNy0dxnVRhN49(y^uYA$w!$a
ziWQgqG?)UdnGSZ9@558soJkv&?<>zsNfU6gcgl~7WM%4mz;x!}pi#EbA&iPkuBrY#
z=T`G_E|c*OCk>E(kQ(omy_&SE)GcCXJ;3Cm3m&gZe>H9<j`1StK8&KNHU)RY@woRH
z<s(X1=t*0|*27KnCmZmT>~Y1nI-&%Eo^)#bp`97qrc;+v&zJFR()HL{2wneBtsG4c
zGC#|fA()pNVViR_&vR$&rTyVvKDG}0saN*#v30To&Xsi{ncqbThAmWRT73lU!#%<I
zS~*2rz#Rq>Agr@xyh6r?Nahjn1iUMI_Som<W_WJio0drrEI?KA^VGi)C7?DBta`l}
zb{_*t-_yF+H!{EVU$OKS49$<9v1Djgj#K72*%^toa0MD|wftOWNAix>$-e^#gbiPF
zMH7#BnN;9?(Yr#9FBn)0!k8s7LZ6S>lw?L7BKIU1b5kqZ180UtrPC0y6!<RTOsGTo
zMXfL=@($mjfft5GCPsV+&UFgw;bW&2_8+3qX7JLU5JuA~j-5UYZ}JXbZ{`}I^FtTX
z;8)nJJAB>B%BpX4U?k|Pm*dI!)&3q~&t1`F_R^Xj`T|2N^f7$kq1CW+A>?ReN)ND=
zJZX};%zVDXE;^x5?Ng{VoRxN9q3OZ^Vi>0!<(YkrS>2ZK#gdk%NbMO82BgirKS!Cg
z(i^9o4IhZbbo=F9{0!@Hu8kBDiD;wnYb4kT%vz+zqzFkDC`Yv+7o{SjLFyv`PpV20
zl)^=-utsJy^$TIu!7HsLveg1&?vhb2K)K(dBuEJp%$QYhntlqDFo})kp++;KX(BnE
zF(cvA^pi<(xsvC+kKT~ZPm}!6SYvFJQeCWgj_#5zLvl-FCp(Ae;Hc5TVA4)8<Ybq6
z)oBjrR^u3sBnuu#IdZe*g!iZsHc~%EF6of5y`Py#&!H?tt5))iNc$^EirLKQDAx;x
z3s)|9D7W6gCkjQt86?@Tw!^xYPc*em?fZqZ?Eb^<^Y@F(-`aY0>$C-@F~$qmL<`p-
zs_(RES!c;<NYuB?=SEAnPw!6DG``b!tuIkrb)`Y9#@5xj!#6v`f?gb22CcHT?GsK{
zn@1-{=S|ZwkGZ9BFFC3$dRr4M8{QqcKJtUH>7M&VKIy!SI07|${U4S$&i1^!_xj$s
zXK(6aP2I8bo;U2MT-)%@iEAg~H678Kj(E-XXwCMU&x=p>i8b3}H7DZbC#LO7-TM;=
zednJ&0)@4QcTZ=3YT<lMALdugwEU!cF@Gcalv@?|)<(UxGneKn7rpE67uJ1ZHqgP=
zaFZ+bf5LekZPS*eA_|gF)H-d3fLm00<v7I%o%PNNvC_3{7?yCl_MW#6Ts<&ro-2x#
zY>5?Yg=x09cIM(cU%U3TxeoXt)a{HFcTZc;@nW2KT}i<;&b~8zZFp`AwC~!USmiDj
zljEJpwaDBd7<ua`m@h?9u)J%(ZlC+g&F5nEM`G1Sm4G#i`OT22>l<e`zT0`dbMDg3
z%2?wrRJ%ETS1;BbygPBP?%4gp;-yL)Ir(nW^`^PV%_n0Gdt#M)DaONb8oap@bgYI#
z8h?~)YjsaMaKv^_QQYN=x_mRGKX<h*`|<wEO`NwB!u@iPmo@{~@%=u>_~bS`xKgWp
zs(W7l14#0|=lBPo?&dic3p%$~64N{9yXM!4<=bQK9XAI=`yM8o?}c#wyFllc`TeE*
zs|EYEa&PkcJcjT2ko(JueI?vNIlnK@u;8mk{+7Xm;#>LrzCy#Tg03w5xLwKb>oDA|
z+SQ65KXX$nKlAXE&*M?!XN4?Z;@!7V|FbrJ-#W|B)|e>2(LgX;t^14ge{FK^&(;5R
zu95OZdb9v<s3Yi;K*F0ag(PX{9UBcIItTp-XA}KBfnWqp6e{6ls#tL0o}538nT%GL
zKLevKRFQelV23B^rUI$S(*4&cr@c?~CCn!AiJnwUhLbBmA6RLQQy)&sk6F=-LGu{a
z_)fH%_HahQ)Xq_T5Nfq^>it)#hxB?<HyNb%HB?A?(t`qZe8x_lL%iUVzKD+v;FoIt
zERCH-BBmrjNavohjuJ(Dkn>RUQn%QcTLe-mgdw7&e?U1_FTI1(cd!e8P4^kG|6|H^
zQ!=aM)Y{jntcMbHAXBx;Fe4qw^&8bTNmdK?cBJl0y<n}UFh~6itd!mdACH+6*c&m-
zQa*XuDI-d1q}ef|s6de>CBN$Q3Jm>#IqH4(7}8u(i$$AZLr8pB$fAVZC)Wjhn*Y16
zYw2z3h{7|r&$X`|JGNsI=YdI0lt*zBrHLpF<UvxDKv62nLm-5%k~Haps72!<AtY2J
zx<FMI{R3UJQrlhEUGz^>Y)lY}tBOkOhFqi4E~=jIj7<Wmio$n3&zaXfGk50rdhQIG
z!GOCNOJeS(*}V*JPt5<)$M%#Ysk)JW<S7dLctigEG0O`B%D4)-Y?+D0)WZmqMtSwh
zcrO#I>0IP<9n1<J-|+Glsz?{S_CHp1+m<x%+LyMKe$l$GQ>b9VOmX42d$3OO>ikM|
z{nV{BKE8sVDz`eiIgSX0S9GnGIRRDL-59N~y(aqvc9o000k&HYgtcyV(Mu}1t=+(6
zaHM0irhj+I0I}~@!EmwLizJ8ZNVP9idR*k`N2o&-B`3s>ba#pPLJLs6X8gRA+Uks_
zdB>w`BNJPRK$dL;0oKm)M!`4vl#O7kEs%W<;0yDocz|Ddg20?bwpRe+*WvM^xenL>
zd=9t+_!96H;2Xd_z)yg00lxsg1AGto0q`T>XTS@<Ux0rA*lbfaKg2e$yk9E-i$Dyv
zp)uGN#9*HWqXC0}F~B4Mt7pwIz%<|_U;(fMcpq>MZ~<@yz%wYjbwRMkhm=&;);BkU
zfPZ&5&vlSh#&hDtnI+T-fdAFIF{NI7p&rKOp2vuehM5#~g*{Q4;>p&_>_oa~NrzFU
z*3q}eXjR))%^|f9&NozqF1PfcyiCN))XywGi@r%cweBG+a(Yo@-Ouk3hd1*ByR4IR
zFf3-M5cYeNvDw2^;IkWS6moph$%SQ+b-yDd4!37?f-({d60um;{Wn5lX$yzwkSHOc
zghUoBB@#<Jue0=Styr>A$kA~pr#TjXuKVebSlWRcb=LZLLkh_0IVaCu5Lx%zLgH{c
z$d#|R7cH@5|0{pM#=#P*v)lS$N!8V3Q($eXv)87<GAfw~+rj#CNM5p>S1UP~OAh9e
zgSq5jE;+N1OD~807c^I7GXmS6JoPMEpaos)<%<(CIpav(FYXXRn)U~6R0@;~D<1XQ
zY?6|4v5-^qHp;T@cZbB%7Tee?`LZRJxX8mc4wg_|!`25&;(}6OeQA16OI(m<WT7s$
zP#0ZjDMjP8;;@ZE9y={kT7W;>9-k&e2?-@jQL?n1?KCM$NGMr~lBF&CTzWGp6PK1N
zhPH*ucBbj5=pmtIDO#3c$)h2gMYrdMD8iQhyrz?y+hFL(v$XJfJ1=N(p}fMk!^Ry?
zr~)^9D|XL-b+OTA!#nK~-fRFDX9>+#TmG=2JnC+0m`Uli<FgIbO}S<;GkcU{??mD>
z(+mU4N6=&9)LYM2EU|>u2W=cIp>kY#FlTdSjm|h-(qTT%rQ{{M1C(!O2R53eWgQMA
zXibNO1dj)WEUjxh0CVt>G5msLmyMs*JTh>eY>t$0F^3EFRIacagH7OKu<??8J86j{
z#Wf<rW$QMB;fQC8Aq-FAzuX6t+2Zxk+xgFK@)1i{-CS4c=LZ9rekWcgodnyR%E0z#
z4QGJI$0&rir`%IWya13IfQ`ImZeVcbS!Uy=?35cA9ypZ=08<Qj+_1UHE-8Kj9$i^o
zGX#|fhyxM;ad>=YTOQBx{Qiu=yl>h7X#~e)KYDme29JHW2#2ZOaxOAl!mTKO<2QNe
zJMb~*vcWF&_+g97Hkj8?8?!#jFIYJDp(;-uum+z)Wkda{`<@`a7MvsbO0pGOWv9dR
zAqRpJQZ;xiY)XI;z$oAyz$`%CsYAo<KU3b##xv#)+l~KJ^-~6ZQC91R>ckUO{#|7r
zsob_&e4rM$Re4(t{;CGIRo|bU(qr4I@>mT%QAf7b#Rux*V^w;r`hSb1?l0UsdzVkO
jC!GniF+Ce*h#~9ggN=Nf?r4-QW%QE%y7##fA|2~rCGhde

delta 15907
zcmbVz3s_s%k?_5`dP{&n5_*Cj2!wbV{J;i-gMk=7;s@A?jqPB}m2EH&=Ssvj7ST3w
zTQ~K#c<;7xnxw(o>>B4$lhSTT+a%byiIX;|gz%46C0nOW`?r7pzrW(Rjhl2IGv`Vm
zNZP;OfBkth_netIbIzG_?wmQpKYfw;>dT_^AE%`$DR>_L-#<BW>&xfTjkN2W`&5vo
zSejMz=zFu<vI(y2G4vYSjJ>8d6M0wlXnW0VX28{KT92jI+GZtqdQVPoZd-1zt<BbJ
zZ?pG0+8j`x!D@P(y?JeUG$o?E>1^h6G&V|6Z7$ZtW}Ozd<+Em13%>=dh1H!d7Pq-s
zE31csLN<rZWwTF9+B_m^1H~FnQ>@XO_Z*WDP{ePiCvxamdP`+Xz3*gSXG2eyx6kjP
zWAgq7y&TuYdU=`1kwM4QK+$xf(|gR{)!)ariVlyzCE7^SHeM(0lN5qD>-ZPN7J7{x
zP)-gYCh-p(>+y0@EXW7oL#^$c8|&2V9lmy-_kjU#U#FKVg(4UKGf5Tg;kD9NOeikK
z9QOJ-7h*ENI{bc)bMn8Ht}+k-s&?-QKiAReZ|`EcRX|nDuafPiJ>y@M<<TlT6mU2*
z!19WGUEXIl&vy8|{;pmxR|ka4$8Cxq(3_DlCO+8T-xFiH`us7;p`QK@Kj%bIH2^#!
zt^i47toKmIK#$)if;W4jQ!?xnaB)pgxR%dXy&C*B^!ba_W0aR_qgkp=#L{gHYd%9A
zqFK>tb(`2Lff-{?i=P7yeA=WiablP_8PrHv>60`}pzO4CzFwXzS5V1+Fv0Q^3I%Ip
z6(B(gltCgQNvNP$JF83~Rk04%$*RCQ)Lscvv3WwH3mi#|b+PKxvUxSql4`K|Y+8!M
z^!f4vHvP0Tcb*{wDlBY9N>4Scn}0=Z2o|!LplueY;sINhv}xHQV#_+<C<bd@7#lrX
zLX0|_Ed`Snw;9+nFlcd`5q^#EYf5yY{Ifd2E@Mq89e_DFLAP02DUqjQe0fFzZNxc_
z$-RB-v3{I+Dd+QZUB@^L|A6LhDcT&jnSVuNq_^__L$k%=fr8G&G6a;OB=G+cilRR>
z@)`PjME<n#ZhaL^UmE|X?Bld*3)FI12$u0KV`a?_Kw}x5{XIS2PFzs!eI32tm|}i`
zaoIrNk#XCRj&A36BP$WImH)Cahj#Oqj0MtNQ0n`DzhNwu%<1j?em>pwR!~WQUbo&!
zJ)YfAM2#65l++a&-5?cTk?Rn*YN7Z_Io%)^Us+ZH_*E<2P$<5dBSzdoH!A6?&fEru
znW98cG9{uBXBfn#G)S0|(}*i|4f)JeF5TdePuZl1=c9zFBBP>F#!M~GXcRHmL=wQS
z$rupYDdOL&)``qw-tiT?cu3@D_|Km?%dfNa(mnhOmNKP36FNg4{zZ#{4;{`F56J^G
z|H;83J|kC_ArDaP>Lf`(&YK=B=Kn*lU|K0LKbC9YFQ1WX0yHZP&`(fLiCEc_qUYuO
zyH*pU2q<{kVxtwj!;-@&{VIO5r9>1^@{X-K{#1@WO|{T;Kt)P_dN}K^H=gsT8ynZP
zQdQJ2efFzW)Y*67|FiI4&A<1khyPi&c1s@R&rK@qqBz5l+V4odvkKIcRR+|ctvI=#
z2h<OXSkaLBA@y<kICX;ALmj7IV2;xs75_o5Yx_>%-Wro}ULWo}F)`W<R}O`PruqSY
ze`zP@g)NP>FPK%e{gR0D0!2*4dVQT>&uDD0yNkPhu#3NDa|cr_6X>`$1V<30A)C0T
z3zh+@E$o4Lh@tUv`w?tIuopl~e5@Y`@5gsyx@p981uDUAvFZRJg^jm^V-Zz$D(05}
z|2cb2P6w3wuw{GdL%tc@K0ao57WE^=uVCf<hPv~2R9sx3Xs4qF%VR_5hR!sTRdD9+
zxX7MXaFfqA<prZfm6uB|l|ENKEPmgd`=tMw#^<%q9~!lUT`R-3RTJXZ<S)x7P1n~)
zR&R@#w-3vrPR}h$l36;uDQa*$_RzV9Mh-;`rDL{;;jX#D;?Yf)w_e&hu_97(SER81
zd|K2}G|FB+dg<tF*~W0$#%asO=$gCFH_ljBMQtTvV@W(%NEvb->pj=Y_s?qb!<zi~
zau6QZP@eM3s!OV<!8Y7Ik`dA^yJ;_vde%>_3$1Srxp#gbVa(Za3FTSwAtm)>eMCv~
zvW7F_=~SkDR<kUuSvI4ojFzsQEv*li)<;SkhGlckf@l2CH+(mHbaU9fdcyr$@yo@N
zU7_HP)=2fvh;!F)#+*HGWZSH(D(tG75Jz0K5qsTm+D)x<guQt5!qM4+`fx%0w6;E4
zQ8(N;qbs{<aNW$dE>gXgvTmaP6kkha7Tk&Ffl7DcPQd>(d}y9*T9g0D`x(Yt6b;id
zmzB$Z?92=P*@vHjhv{Y&eL8zXA@zh|gOd6Vy@3{w*H-{~HNO_%lv4|JQ!D8WV(HW>
zG2+$8GF4-T+G`eigH(LYx?T-0uNNZe>oxQSx%Bn5Ncskaq;JqP)V?96u|!I6IlZA8
zUX;2G`OF)+^ah9g4Vx74d<KaM70q(yjf$*hhPlp20KYD0K+x7pG%;QN+h54$f1lS&
zKfv#ES*poyENA;W2YSItA{0LKq`+1Mw?^Xg_jBGs4fsl}fOQ=9mXVUj`4?R+2Hd{L
zCt^Kdn<*Onf`EuK^Br9Ver3MNKE(9h6QH`$rC9QCX;{vmGiw>9Zv|oKC|h611Q^&A
zVJ!%cUy;OEQGkK%g$amG(7tS%Z!aremb%f<)M08!4F4qox{(@Y_VW}qBvnv;RZ>Dg
z$}f}a_>m0x)*)GnU~xc(`)hK?qN#wiJ3Yy?@XMJ$ySzJ-KeyBD@;OpON>C&#eTqpD
zD(Tkp57b(-XzFagU!RnVGWicym<w6i(MH%#sy-z}{%K+z2v<BM`LysOApBKU$<jTl
zAvyU~4=GsHkdjposaP7eYs-AY$|O6CmT3Pn7_BrIt(;_i(#=^xJwmheDX@vJiyvdY
zAdyf*=>dv=(W<{knv^h<k)m}P>3e!0WAW^;^k)y>A#flAif#v=S*y*<NJ=E7GJtSU
zcv3v12{4>zfv%M~OfOIdG;HQtP&-A3ETV&!Sd1=ppi*e`e%$%V6VP<$<0SI#I)@`0
z<QYs*&KeOeF^%+YH)_gI-GzLxPM>djN)*sMZ+<Re;g7&EiHwybF;<y@%<dw-<G41>
zaum)0+*1k)N=*EFU$@j|rD$VKj9S*>QA?r7`LrGI<#i?|H;{q9nKo=m=#Kz-Pn|8p
z?#Gh|d7!=wO%15iMGA`7EH`8(rj&-2+xKKrRk!2lK2UW}AT6L|je~ILI11h4cBCld
zB(yL9wmhP^E1&|K%zsLjoEALS1?1f;aIoB}Wa-l3fwiV$3kJc998xXSXjpU>hpGxE
zMhb+9QDf8sp&?auT1*AhpF0vzch}=s2MYu0<ctjI{0;LXpbN<6%k?SU@dWfs=2;(*
z9j$^+XQogUk**dK+Ia^DG-J5bnJfwD(_t)1iSd=8@$v8IbISty<RHLM+ft;Kqtr#)
zPhzKlGxsoa_Uq6!F>%VoXD#5GF=uB1iq3wIxM}Z$M+Qq*c)%korBjzd(x@`KE0Z(}
zzkkutz@Ugi&^~!+Y7csZ4<+3<((r=>x(U>QkNC?xs)Bk1*77Ma>=eZMtKb0PqmPS_
zpBNY;xPQ<E52(F5sS21$brN6rJtVpd`m+v(cd-?&Oc^@&BHK&Z4;O5Y0o&uZTsBuP
z7#j43IeY41%8#1{d7z;OhqM80Hy)dpJi_X&5thV#OO)A`qKxw|^8by?#JhNzEE>nu
zg|Y|sm?7;$TIj{?hZFdMbG^hMo*Bwc(Q%pZ4K#v%rU$YYTR<RTc3U7kQ<3u3%ud?v
zgA}JukyV*22YcShF8?f!?j~HkZA%zeq%fAUD?f{I3CF4w4juWd<qa7EhVG3hz7FjR
zMkM>8>|x2-fPgKG2RUq14Vut-@!EUgn9&6x9DCB^@$r9lm*fmu8t|ae)pvNl!hXEV
zf5g7AvD(fzROItr75Q2YK7tg7pYFqgk;K>Wf4{DgF6XD$ou*In_uZAx8=72}K~rPG
zpMrBspC9}xdylv8u>T0ix~r+wG?>-m^&RW)^Lgz@ydA8U^HtlsZo_Khk8iQ97)&p*
za}XywiQ07a*$2hGva&J`Kiq@*oe<pVAMo1`^>YiFax9<Ke7bzFbZfueH_+MX_4y7B
z^nj2=Bb>L>+w~xvq84%SH@8~;VOxtLCc}sk2<7kF)*1BVbFlX(jzROMqL}0uhfyF5
zD3Ie>OqS?b4E#elgT<sB$BsduA;v&YIXuLZ6IV>ab@Uzfk}yFmqy6AOR}b6X3!yJO
zFU2J6K<_ah*9Fuu@lo$dAJ=^lIq`56Q~4l3HsEXT?1uqzV2La-Sma0+6Z;`r2Cesa
zy~oHAFDBd8+Qf1FTuhx9CGy5;QRD#xxKVPe_&2vXT8%;&LNRX!!m+LwC}K+D-?9*e
z^TjlWI=XtiZ2JP8A4$|4#`%13GR0V(&|SWNb?$mK5Vj`=J|=?@pSSmzKc+h3_aAHT
zB!NioB&zWcf&)Yr#3cK<b{0mZtB330zu%mrjxpX7og8?ul+Va_?6Js%<D!p$y4b>g
z6N^I-gCxhr57d;}a?@Eb>s%9du9+y0I5*8&H+|`zxRlc9W-~m~8J?)!HEXX9+pEu|
zL8-fVwxBj#P&>iCcJ$?=vvqsIb$cQOZL{{a;k0OJ^{{wGQ}jOn^Wu`AoO0xyQAUeP
zLvmx(==hM@B~qBqG{;3dMQNt@ZO)O^7i%umL~P~5>N$-*WL!SBWvnigy?#d10PPs<
zvj+FH!999nwtQW<eBEq$Q@FforhLPk&J?nijRr>hCboslTV{0kM0KuNU2#}fJlZ^?
zTN%|^-`8djp9lhf*x-(63rE*XYgYhU)Lb&UZ**&@dfUwQ*3iy<vpd=FPByaL8`^d#
zbf`CE?7Pi~^x4q3K7X;m52aM5?PnUx&0O2CDw^v6V9Og;zi)Gm?2XteKBQXcOy}^1
zxM&Bhch2RNeXI5(Dp+H3#wh?}n?Yh>$*j93?5>$;j<}o7H_ureA=h1#*2(ni2SYpd
zgtoVZoO@@i`+%~na%}bN@`mv8hEPdkw6tPu#Y@#MR!<y>EZ-0+X^y&!NB4yas-u<b
zKTt^WbI&(@prP!g(VBIWx;M;M%-8o{-xjIg7pmSL9Fc?yR)y_VbN2jb!RiU?M0)7%
z{h|AhhW7V_dU``H?5)FjTTbOTL$3O3uE~Kn2CocG1tRNrhU#~PocGRH?*lzYwv9DS
z6opqbO?HG=G>4XN3^_N=SU2A+T|HY`8!oMl=D9D{UZ@=@AIk~Z*F_78;gnuh_aPNz
z%5p!Vn8Mui&2c4VFPyb458IZH`KE2vadDbs2OV8r^HS}Lwd3nXw#>Oa(V{Ka_g&u_
zYTFmu-xb=|9V$Eu`sEkgmQwjep^~O+o!1LzH?@T~wMFjU8*17YD%wBex*r%}lqPpi
zZVDA`n{jO?@3j+0X6ssl;kuSkZEL7#=ZtF?DX;sXf3kVDac8)3XJp;3P~E+uqWflC
zyCI0+DEMeE4O8_I&esPB;`h^wb-tNbG`e@9;!^u`-ddt=)r5R@^_KAJEupG=uHPTp
zcO<m8E7Wy7PEjZ6Mp2v!LO8VveyJwWM*Q(?5|IwU6c?`^bz=->LKP`$oOLyZT#Zpz
z`B+8RwPIv*)K&6P{}N?5n##$awXO_XSI$_gqQ%QE*Iuf9Zr%AUQLE#l<4cGoXpHgh
zpor4hL)zk~d-<%pD(tSBP)x3kxVMLNuDP7TkY~-r+DK0G@ZIm@dRjI1;MkFndEJce
zF3``IJ7S$Sl+GDpMpumm#`-2VUO#kwcPRJX8RLB)$SGq!R7G>$qtcNRq4FJ}miEw&
z1EB*CgsdEN(PWOxDZMQ?tIH4T@<$Hc(3O%lHeN5eo*Odnp3&`Dykh?p-zdhtA>JpZ
zH0F@p6yGMHayCO?1!iV1{A|G<{wZDt#`N)RJ5^Y5ixPtYk!e`48t?4>?(qKZ(7vOg
z!k*hqaKU(z1~Ti~9#<ge$MJ1~$Znd-Z-N$%3a>cxcZd-zSi;A|9`4*8ggJ1H+&7!Q
zCY-+}WU0PIDfG^$#W}Kftl~oZv}FaXm8i37LOu4-<o%(Y?ZHqhj0qdEdtpp+a$#8W
zmW{YCmR=|wQ$?I>XRT|)*0oWqd$b~KEjhnAW_8`PI_4}z3Axs%s~@kPwN!*H6=SW_
zmemvYO`Zzvy7x+Oy7peuQu!GDlJZ66?6SMV%kB=9Z<u^2bnn5?uFg>B10ilG^g!?-
zFuEY!fVSsoMBDp+EAcK-;*+=*y7tNKMw-&)+@dnlOk{tq7%P0K_{HL}oQZ>z+DS<$
z`|cUdhNuSOZ|<<hJu08kR6r+nrY9Rlm?xUUL9Gk7YBPI7=Z)%fpUE5P{8r(`vI}Jq
zXJuGlN$NJ<&~1w9%};iY<UMgDtS=yi4L5X+ztp*I>T+gv?y$~1qw~D0F@6%afg*qQ
zJq?b|!-m~9`f+;u3h_7UrGQ?s)7z`WR~&VKU$xhJc9n~+DS|Y-T~pSl!`qLH`0^uD
z4&qhmEf(?X5_)^J@^vYLxS~PRB9^^rqPN#7-!y9xFI%tJK}mmHMZ?RFSF3>PCk(w~
zjr=EKG2(I&NcxGgUIo=}>**b9m2YP&5w|1h+r{*bbwT;tB}n`BGNgUG(gD@)XtDa8
zT)IUhf5(Qk@8qplLv^Se`w^-_HAB@jRD^1==`dBfW0fLY$soRxMtl{)*C0)JEumS5
z__T;Xv9u*yHLavu(t?_4l?-39WLRxNEv7B?;$0=Oh>dP_DkF9!;zbNpL`oHiud280
za?5V$>0L(Ujcg_2b}3ZfD4-E{OMvJ`2{PO$SM0V*ZmeE!+HH_TGg14fK>|flD+73^
zh#G%&dy91Wx4_%ro<Z=>2>u1ZMF24k_^03k;Z2XPe}L=s!tH36A8tnvk2l=cK?l*z
zi7C2#{or->!i6IqLCH-c@xwee;(>AKP7#j?Zl}m40Cx#X(81=OMSyWA?s)_+Aow<d
z%Lv90yolgC2*we77s2-s{3{;rxR(%2Ab1(U_YwR6!4DC<g5XsIuOXO3a0S6te&3!#
z;ezZ-{G)qp#%*A;zVCti|98|)tz}m03Ts_w<Z<Qrl|2_3DY-Zk@%3kP;}7ruE=`~1
ztJ+ttJdToB03HRm74feDh{@5l@AAS$v<}NE5RjX&J&4`UUud^>ZAU^?(&a=CliW-k
zK#B_p&LTjrn1ncwG1;+>lW?oc`Y>Dyp<Ce*oW|FoXi%FHzD;WIFZ8(ez*;&Jd7x|b
zhj##bjPld`l@2W*=&0h;Rw~m2v|k1U<nb%`sMleEd)1Uf+x)S6Nb1kvgB>>hj~$h1
zvIVYyn18QB&p-F1Ha+mEVw;qm56L7?c`27ygf&N=tV#YZr7$RxHOXIA`J`k>&i}l_
zz*o1Zq`pizK?{0Rx2Q`LT(%$21wyaDl@=aWJqUdbD3URvfSgsW<>xxg{5KZM_(n^5
zh2gJAP^L&oM@#JUBwBx~CB6KwwXIspnc(}lCB3~YB?74S<DC?Fk{p~Vpl+nTn${^g
zOm&L(!<ExeTFNY>C5Psm=xl}<D2CGd=)(}CV>3|0L_0;TYDYSkp2C-&<O51g3S}Em
zW-OwdkKO_$iO42oJ_?kYMU<KpnOP|^zYmm|izw$4LqMiBh4Oy^W!56ftQ48L6iV|>
zwL`mzQkz1lPodnjQ=O^f>?xzH^Jnu{6k3NNG1OE*m*h>1U3LopAhe{1mNMt5=VN}L
zy<vf})R>fV0^%0HVVdWdkG24Zae;$>2V@%-Q5upmfYOvg`JX^(TtqqF8c>>3D9d)K
z9VVchU*7>!icCui<^4cu2Fit=nNujODU@FUN()eC%=gHWLYb37`RXq9N-JlCy=4AQ
zB1IExk}LTOy62{F|9+QxUCv+R&Pj45e}UVE+$k-P-N0dAxX|vlCv{%<?RG-MT+9EE
z$uJM)f~vM;RUkJhddP;mOwi%apRc1K^FxwMNJ=ixA-mr_Pa#cF#GaHCkOypu>n#c{
z$1r7R$+I}XFH}D7d=3&dg80%(LG%wU;)DmHn(3+G;N*?YkQ5@I;<MY6@!U>`(Bf`z
zd=a<bnv`=$1d`+s6;vnZU=MZn|0KB+Ep8^%e}Rb%JuuBJVIn*rTnlRECY$TF<E3DR
z4d{QEr1#|U%R5&IE`>6Y6VMJm#YJG^&_js{KFY^Rj0%+>>*?s~Tkuyr5<(+TFL7lq
z0W%~Z_y&4=JGhg7-R}tgO^yeu^jUt#C{~;X0P2({aUmE)T%#VW%I0v^6Ok&!NW={n
z6PJ#2Oft4eb{EOWA{h;w9jm(#)FWsB5L4_tdCV&Wz;JVkG50mC7rZaxa^Qxxko4ej
z2;ndpR|$cr{!Zd=KtdSAvU)p?#ng$2U9f|^DzUtaZHK^L3~!Fx2L`}JAyaV@#o~~1
zKSgjD0eW#U#@})H|J#*ADLA4vOI*2_T5vquAMEHE@Iu6pxS{RdzJcCYS|UCv)cG6`
zMRO_=ciP+={4=ae_6j<6CJFyjHctXUifjk}-XU$dZO&jhzbRsHpJ|53irz6|xM;ax
z8QnLrcD817xMuV9&5@ej5yzg0uI-HCww(Xvk)851S%DJV!EF9lz2A_A)p=2^jlX_u
zgttE+=4*W}_}>V{j;Ota|MkFINp#<dUO@A)^zFfe^01~18Z=t?!l8Uk*__!kS`sl=
zo!Ja$ag&|j<GtH?=k_iUoUbtx0kpL8$G_YhX8`~6t!0$G`VJiT_?lC-!B1|h6I3W=
z)?6Akmp-}~Da$_gp(lDpqH2MRgVL-Pm-w9;LyL#{X@Q}Yp+Xg^)*NbDscmsE({>u6
z2l9cK>2)-~2%~E?GZ7PwFvrxohKa1E0d|T(Bt9^l6x<b#e`BawTyzRvJffHc!lc~E
zSccEr!F3*i^hiGj*?q(>=8A!ayUwd0zBh>57k3=MU`8t;wF`mQYP-iE1f)^%m?Gi3
zcJ#!gf=H5RDY(%KD~Bu^bhkNleg#i^!O4CD%j^i&Bf#adhr5Yr2tf@12u*tr4jdNp
zezd|#<=?S#4l5P@BXCwZ(%+MC%zutGBy^nYXEFlJUE`}C$*a4L1WzC!?mO|^HL!9>
z&P98|cPB?7Fyc<Qrx2``>i`y?7ECugSMcS30R@AZDZacg2*&ZBKJqlvx^T*nvfduA
zUpQlU#De}r338BVN3l3-cuWuk|8A*ZLBM|g$`}7pbXGK<;WqyHGq2H@C&u6NXes`t
zpOnJw-@n6uC;V3=GsUvuvoQYwfgPT~OPZ5XUjOCF;7(|3t6%{nk1KtCBs%*C;F1B(
zB9tdXNDa&aT-Xg4vbc6&8R-bPxQUI=ff$+gJj9w1>_u=t0FP1_0m8Edzf{73>;Pg%
z0mL#PdkZph;j$r_y(s91dvXjf37`g4^MQGjLBoN=q2n{pT0MtEFq{^!ej$BJs#EAc
zoxPRu8QEJmUCXCkEo1(dPQ7?)wyGsu)e_P;=KkiCE+(^baY|RHVtvH0KI$sFxb?!;
z(DH`K9TC@t^NKlJ!N^Gna)*r-ad~iQ@>T|jf$*-;v@|u!f~iq=;$}>Z3Tg6}rbNvN
zDN*`=)9P?*(f`?Z9tP)Ox=9QfQH?7hBdXB=8BvXy;_>w=K(DUL1vnMV(L&|aGP+SK
zovIKcz7lz+R?%3!8f&kq=tjNxni^}bX|VQMCe~il(paJ=(4cFqWUdv{jb-v{B~rvI
z8LVBYXrh^Gbt2&U5k&+3Bbos`nb^u_e&s)RkiA6G+0*ay3i*BWn}dfDOa)gSIbknK
zhT?8P@uE~HA|oi`4}A587Pm7GP56^};e7LOf#^#j{@C#Ia^%Ie$h*!J(r*5qb1u=}
zi^hHD0<`)NR3%nKIseH&ID@zoCc*|W)q+v_Vp75R5xfNQB_~F|4CsYzj$|rIg-+n=
z628F)5bH;90e}w=yu^YNIbNB9)OqvgpXBYL^P=%r`8Vk``;d)nEuSEUI|XSfxv!8_
zg}WcOWMAPYzqUejLB#*@Yd;d*mDoaPKQsQjuYZ|rA!^KOIC}~H%kn6G+xa|xHrv2|
z>HJ;1<ncmv>Mp^rdEE8avpNO$XUQ(`1ypK&7Z5h{#8$8ct4OB~AVxL;&B8#F+-2b_
z1tAvLlTLDGGMZ=?pWX%j_;{uJS=<FA^!zT6so3-xNt|k4Ybr?1;JjJ3ETpmjZHqp~
zb&C>Z)(kgAZLX(JK7MjEJ7QZFGAtYRhYic3#===+dDvL~U1qFtTyeu#9hU$xUIr8{
zS=zR^L0H?_pONYa>zY?R;e-rFKlJrsx-l2lb3+}h=LS2h=LRceI939BwIB!J6r+W@
zscgC-S2|@7BW^*KDM-PFT1cjb61%RUhM8JHH&n@|R!R}CVX(YT(P)8O>Ws#0=32G{
zaSH>yWT}piKk;We$l~PSx)MC*w-KASYFMkpkDf2!Xc&HvD#cidQ(TH%WUUYnfmnqT
z%RYP69Kb4K>Wm%a#S~=z(ewTE;^DV`vr#lD8vn;{o)#JK1AB>%$qse(z^B)jSkT3M
z`Gvyv)CDc=JTlOCRJiv}abFzRF42%g2FXH}2n(5fx>2u~gzyTANT7hMV)zdI>xI>#
zY0-H6LbXVSg945770;Bnl6K|7h>-ZBEb%ucLIN~tjttF0o2l*swkb5W;4bjv&s2)$
zMC1SSncE@{(M$ouwBXUfw4mj{zJ=WsKAfD27mpSR+nRbo8^JwOAv>9=g&`n1k%{{v
zs<5D)JY__lz-BUp(VV|@=YE3>YLE$M0HQ(Czq)|Vgij8Dj2ZwKxYtJ4iheB`|BumQ
zbdCn99>G9p84RtE%&H(+rI6wEEXh#)alV3o_SqtlUo!rSXWyggLjKzGuQ1|nlD#<o
zxfi4~oyY(F1si|y+nY<0$9hQPqR$r3r*VnSmXoZhKM**XM+IcvX}sgn9Ddj3+^VmG
z<KzN8$ODd(Zb-WjHed|_ZECJqKnuzBBo}D>*~_i8XpZ9lYphsUHDqa!1%v0Yn0!|s
ziO#daiSt`fCVU#6LF^p_rvdyHCv=d(gp+^9GW5l`p8)X4g~dh=cZ<34k3LA2OZzd-
z`(T$>eq7+a$iMiaGe|xkWV`(=Uykg~WS+@pOni1?3d8{H*!qG|kVQ+DZxdFaYbR{#
zI>9K=Ip+*$P2`(IgqeG>aACVQV)X$mJIeQbr`jArbOZtE89Bgqz^hLOZnr@M7V_Kg
zlo{@bpyU_;!Nn`6Q8d%hisgLSxI;2$ay^m5?;Zaoqfg7?>%V(X@TSHztFebQ_M5q`
zsH0%6z%yESx#UvGSYWaxQq&wN*f{4d8eM&P?WMI7X_H)}cvHl^8B_6_FK@ZDWg_>w
zHBxeKr0~9*7U$D7kJpTxoUv5gW~h?#(c_m-T{<<fX7XU9d?T=3Uva%5RJ=XZx_i2K
z_styJTtVsRk;`j(F7-^Ty`C8<+Z-v_GM8UCYPf8<WEtBxSsC%%9m(JDfnKH0{v(r?
znHA3jo#SP2OBhmH<A?dp-}6YCX-Z?_Uog4&r@ki(>gm(QjVq}q>5VG!Q)a*>92<4i
z6%)NNU3|stLcC53#aA=wjhW)BS@lYIf!%*&rFbf*sT5w`RMMOD^qVRg@pKwE-UM2}
zb-In^%$tSu#$x%K9x3AGVk}>&*p$V*S(mXXjd?4WCV`i?vKSBn4#y6hC^G=OE%Fa=
zeKGOY{ys1K37Z4w)d>Ko$m|ni5lVsHBNc9%3@8BWKZYzH&K|HMdxBXYL#r7~$G;KT
z+t}Y3BuBLUg2+5<14VwUAoU<&KQxEC9Y+L{x=gmK)4vz$O6>gyyWwx4_Cw=jpCl>~
z<>n;~W<VpPjifHC1vREoXdXoL62?5wL0a;Nev3zu!-vT8>veF#A;(kF0$B#@k^g-J
z4G2<O<$v>Xe&b(Kh=h=mW4O>Lic5~N3UN92M~dI^eOvG&cpKEM@9=r&|I#bjl{;9K
zCJaKdY+;^Y2BBU!w2?s3LTlKKqz<G@gsUD)6Ep3?nMR!dzu(X8Sm+EPbYrDBWz0!w
zK4JMSi;d#823=SfDY9#jF-sjOpd_-a{Ll}|f}4>u6Tv|QWMdmZ%!lAh2wq1(;tRh(
z>~{#_2+;ZGZX@^;g8xA9UkJpY6(>WGhCqWrkAV0dY3-0S*5UJYdV6}dx3|OTq6L`9
z>EbTo;JyKcAVBSWc_NCsbDH`$@m+rqOC+n}>6A46mdF5W`a=fLxPVp`O4{l8PX41G
zI+yo}B<85e9cKtqyFoy1Dza`#uq44o&;ycPv?M#;$De(5rECu^QN|w>@$bI&g^X;8
zK0yaqd>PM8?#$FmHYM96Xc2#7(iOai236p+=`Q|2Mev&$S#gO_3K?3uxGYIwcEtsX
zxSCQrZl#fO(#mZS!8uQ|=P=a;i02_#nChjagIWF{{`Kx&!5~ZQ@R7r%Svk+U95Ls-
z6vRF)8`mAo1F;}!O2duFw|<@(F;6j90#g}NwznS|fZfWQ-rmlMkz^NwHN50%TO|WA
zR}MW72tu4Z2Ej4>D`0P*5AM}{#M)vKOddQT{HdiD2>EkYH`H-CD54Mn`FyTItPTPB
zHWITa##b^-Zood4ukGz;2YS49+-lxARc`(jmHRGL@R5?D%ipD}zoLqNPVI_NyWXX8
V`J+=V?I{)AOb=WBKoNw<`ES-go(=#2

diff --git a/ingest_pipeline/storage/r2r/storage.py b/ingest_pipeline/storage/r2r/storage.py
index daff13c..1c43302 100644
--- a/ingest_pipeline/storage/r2r/storage.py
+++ b/ingest_pipeline/storage/r2r/storage.py
@@ -10,15 +10,14 @@ from typing import Self, TypeVar, cast
 from uuid import UUID, uuid4
 
 # Direct imports for runtime and type checking
-# Note: Some type checkers (basedpyright/Pyrefly) may report import issues
-# but these work correctly at runtime and with mypy
-from httpx import AsyncClient, HTTPStatusError
-from r2r import R2RAsyncClient, R2RException
+from httpx import AsyncClient, HTTPStatusError  # type: ignore
+from r2r import R2RAsyncClient, R2RException  # type: ignore
 from typing_extensions import override
 
 from ...core.exceptions import StorageError
 from ...core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
 from ..base import BaseStorage
+from ..types import DocumentInfo
 
 T = TypeVar("T")
 
@@ -80,6 +79,24 @@ class R2RStorage(BaseStorage):
         self.client: R2RAsyncClient = R2RAsyncClient(self.endpoint)
         self.default_collection_id: str | None = None
 
+    def _get_http_client_headers(self) -> dict[str, str]:
+        """Get consistent HTTP headers for direct API calls."""
+        headers = {"Content-Type": "application/json"}
+
+        # Add authentication headers if available
+        # Note: R2R SDK may handle auth internally, so we extract it if possible
+        if hasattr(self.client, "_get_headers"):
+            with contextlib.suppress(Exception):
+                sdk_headers = self.client._get_headers()  # type: ignore[attr-defined]
+                if isinstance(sdk_headers, dict):
+                    headers |= sdk_headers
+        return headers
+
+    def _create_http_client(self) -> AsyncClient:
+        """Create a properly configured HTTP client for direct API calls."""
+        headers = self._get_http_client_headers()
+        return AsyncClient(headers=headers, timeout=30.0)
+
     @override
     async def initialize(self) -> None:
         """Initialize R2R connection and ensure default collection exists."""
@@ -96,7 +113,7 @@ class R2RStorage(BaseStorage):
 
             # Test connection using direct HTTP call to v3 API
             endpoint = self.endpoint
-            client = AsyncClient()
+            client = self._create_http_client()
             try:
                 response = await client.get(f"{endpoint}/v3/collections")
                 response.raise_for_status()
@@ -109,7 +126,7 @@ class R2RStorage(BaseStorage):
     async def _ensure_collection(self, collection_name: str) -> str:
         """Get or create collection by name."""
         endpoint = self.endpoint
-        client = AsyncClient()
+        client = self._create_http_client()
         try:
             # List collections and find by name
             response = await client.get(f"{endpoint}/v3/collections")
@@ -152,6 +169,9 @@ class R2RStorage(BaseStorage):
         finally:
             await client.aclose()
 
+        # This should never be reached, but satisfies static analyzer
+        raise StorageError(f"Unexpected code path in _ensure_collection for '{collection_name}'")
+
     @override
     async def store(self, document: Document, *, collection_name: str | None = None) -> str:
         """Store a single document."""
@@ -161,20 +181,44 @@ class R2RStorage(BaseStorage):
     async def store_batch(
         self, documents: list[Document], *, collection_name: str | None = None
     ) -> list[str]:
-        """Store multiple documents."""
+        """Store multiple documents efficiently with connection reuse."""
         collection_id = await self._resolve_collection_id(collection_name)
         print(
             f"Using collection ID: {collection_id} for collection: {collection_name or self.config.collection_name}"
         )
 
-        stored_ids: list[str] = []
-        for document in documents:
-            if not self._is_document_valid(document):
-                continue
+        # Filter valid documents upfront
+        valid_documents = [doc for doc in documents if self._is_document_valid(doc)]
+        if not valid_documents:
+            return []
 
-            stored_id = await self._store_single_document(document, collection_id)
-            if stored_id:
-                stored_ids.append(stored_id)
+        stored_ids: list[str] = []
+
+        # Use a single HTTP client for all requests
+        http_client = AsyncClient()
+        async with http_client:  # type: ignore
+            # Process documents with controlled concurrency
+            import asyncio
+
+            semaphore = asyncio.Semaphore(5)  # Limit concurrent uploads
+
+            async def store_single_with_client(document: Document) -> str | None:
+                async with semaphore:
+                    return await self._store_single_document_with_client(
+                        document, collection_id, http_client
+                    )
+
+            # Execute all uploads concurrently
+            results = await asyncio.gather(
+                *[store_single_with_client(doc) for doc in valid_documents], return_exceptions=True
+            )
+
+            # Collect successful IDs
+            for result in results:
+                if isinstance(result, str):
+                    stored_ids.append(result)
+                elif isinstance(result, Exception):
+                    print(f"Document upload failed: {result}")
 
         return stored_ids
 
@@ -208,6 +252,16 @@ class R2RStorage(BaseStorage):
 
     async def _store_single_document(self, document: Document, collection_id: str) -> str | None:
         """Store a single document with retry logic."""
+        http_client = AsyncClient()
+        async with http_client:  # type: ignore
+            return await self._store_single_document_with_client(
+                document, collection_id, http_client
+            )
+
+    async def _store_single_document_with_client(
+        self, document: Document, collection_id: str, http_client: AsyncClient
+    ) -> str | None:
+        """Store a single document with retry logic using provided HTTP client."""
         requested_id = str(document.id)
         print(f"Creating document with ID: {requested_id}")
 
@@ -216,15 +270,23 @@ class R2RStorage(BaseStorage):
 
         for attempt in range(max_retries):
             try:
-                doc_response = await self._attempt_document_creation(document, collection_id)
+                doc_response = await self._attempt_document_creation_with_client(
+                    document, collection_id, http_client
+                )
                 if doc_response:
-                    return self._process_document_response(doc_response, requested_id, collection_id)
+                    return self._process_document_response(
+                        doc_response, requested_id, collection_id
+                    )
             except (TimeoutError, OSError) as e:
-                if not await self._should_retry_timeout(e, attempt, max_retries, requested_id, retry_delay):
+                if not await self._should_retry_timeout(
+                    e, attempt, max_retries, requested_id, retry_delay
+                ):
                     break
                 retry_delay *= 2
             except HTTPStatusError as e:
-                if not await self._should_retry_http_error(e, attempt, max_retries, requested_id, retry_delay):
+                if not await self._should_retry_http_error(
+                    e, attempt, max_retries, requested_id, retry_delay
+                ):
                     break
                 retry_delay *= 2
             except Exception as exc:
@@ -233,8 +295,20 @@ class R2RStorage(BaseStorage):
 
         return None
 
-    async def _attempt_document_creation(self, document: Document, collection_id: str) -> dict[str, object] | None:
+    async def _attempt_document_creation(
+        self, document: Document, collection_id: str
+    ) -> dict[str, object] | None:
         """Attempt to create a document via HTTP API."""
+        http_client = AsyncClient()
+        async with http_client:  # type: ignore
+            return await self._attempt_document_creation_with_client(
+                document, collection_id, http_client
+            )
+
+    async def _attempt_document_creation_with_client(
+        self, document: Document, collection_id: str, http_client: AsyncClient
+    ) -> dict[str, object] | None:
+        """Attempt to create a document via HTTP API using provided client."""
         import json
 
         requested_id = str(document.id)
@@ -255,29 +329,36 @@ class R2RStorage(BaseStorage):
         print(f"Sending to R2R - files keys: {list(files.keys())}")
         print(f"Metadata JSON: {files['metadata'][1]}")
 
-        async with AsyncClient() as http_client:
-            response = await http_client.post(f"{self.endpoint}/v3/documents", files=files)
+        response = await http_client.post(f"{self.endpoint}/v3/documents", files=files)  # type: ignore[call-arg]
 
-            if response.status_code == 422:
-                self._handle_validation_error(response, requested_id, metadata)
-                return None
+        if response.status_code == 422:
+            self._handle_validation_error(response, requested_id, metadata)
+            return None
 
-            response.raise_for_status()
-            return response.json()
+        response.raise_for_status()
+        return response.json()
 
-    def _handle_validation_error(self, response: object, requested_id: str, metadata: dict[str, object]) -> None:
+    def _handle_validation_error(
+        self, response: object, requested_id: str, metadata: dict[str, object]
+    ) -> None:
         """Handle validation errors from R2R API."""
         try:
-            error_detail = getattr(response, 'json', lambda: {})() if hasattr(response, 'json') else {}
+            error_detail = (
+                getattr(response, "json", lambda: {})() if hasattr(response, "json") else {}
+            )
             print(f"R2R validation error for document {requested_id}: {error_detail}")
             print(f"Document metadata sent: {metadata}")
             print(f"Response status: {getattr(response, 'status_code', 'unknown')}")
             print(f"Response headers: {dict(getattr(response, 'headers', {}))}")
         except Exception:
-            print(f"R2R validation error for document {requested_id}: {getattr(response, 'text', 'unknown error')}")
+            print(
+                f"R2R validation error for document {requested_id}: {getattr(response, 'text', 'unknown error')}"
+            )
             print(f"Document metadata sent: {metadata}")
 
-    def _process_document_response(self, doc_response: dict[str, object], requested_id: str, collection_id: str) -> str:
+    def _process_document_response(
+        self, doc_response: dict[str, object], requested_id: str, collection_id: str
+    ) -> str:
         """Process successful document creation response."""
         response_payload = doc_response.get("results", doc_response)
         doc_id = _extract_id(response_payload, requested_id)
@@ -288,11 +369,20 @@ class R2RStorage(BaseStorage):
             print(f"Warning: Requested ID {requested_id} but got {doc_id}")
 
         if collection_id:
-            print(f"Document {doc_id} should be assigned to collection {collection_id} via creation API")
+            print(
+                f"Document {doc_id} should be assigned to collection {collection_id} via creation API"
+            )
 
         return doc_id
 
-    async def _should_retry_timeout(self, error: Exception, attempt: int, max_retries: int, requested_id: str, retry_delay: float) -> bool:
+    async def _should_retry_timeout(
+        self,
+        error: Exception,
+        attempt: int,
+        max_retries: int,
+        requested_id: str,
+        retry_delay: float,
+    ) -> bool:
         """Determine if timeout error should be retried."""
         if attempt >= max_retries - 1:
             return False
@@ -301,12 +391,22 @@ class R2RStorage(BaseStorage):
         await asyncio.sleep(retry_delay)
         return True
 
-    async def _should_retry_http_error(self, error: HTTPStatusError, attempt: int, max_retries: int, requested_id: str, retry_delay: float) -> bool:
+    async def _should_retry_http_error(
+        self,
+        error: HTTPStatusError,
+        attempt: int,
+        max_retries: int,
+        requested_id: str,
+        retry_delay: float,
+    ) -> bool:
         """Determine if HTTP error should be retried."""
-        if error.response.status_code < 500 or attempt >= max_retries - 1:
+        status_code = error.response.status_code
+        if status_code < 500 or attempt >= max_retries - 1:
             return False
 
-        print(f"Server error {error.response.status_code} for document {requested_id}, retrying in {retry_delay}s...")
+        print(
+            f"Server error {status_code} for document {requested_id}, retrying in {retry_delay}s..."
+        )
         await asyncio.sleep(retry_delay)
         return True
 
@@ -323,13 +423,13 @@ class R2RStorage(BaseStorage):
             print("  → Server error - R2R internal issue")
         else:
             import traceback
+
             traceback.print_exc()
 
     def _build_metadata(self, document: Document) -> dict[str, object]:
         """Convert document metadata to enriched R2R format."""
         metadata = document.metadata
 
-
         # Core required fields
         result: dict[str, object] = {
             "source_url": metadata["source_url"],
@@ -465,7 +565,9 @@ class R2RStorage(BaseStorage):
         except ValueError:
             return uuid4()
 
-    def _build_core_metadata(self, metadata_map: dict[str, object], timestamp: datetime) -> DocumentMetadata:
+    def _build_core_metadata(
+        self, metadata_map: dict[str, object], timestamp: datetime
+    ) -> DocumentMetadata:
         """Build core required metadata fields."""
         return {
             "source_url": str(metadata_map.get("source_url", "")),
@@ -475,7 +577,12 @@ class R2RStorage(BaseStorage):
             "char_count": _as_int(metadata_map.get("char_count")),
         }
 
-    def _add_optional_metadata_fields(self, metadata: DocumentMetadata, doc_map: dict[str, object], metadata_map: dict[str, object]) -> None:
+    def _add_optional_metadata_fields(
+        self,
+        metadata: DocumentMetadata,
+        doc_map: dict[str, object],
+        metadata_map: dict[str, object],
+    ) -> None:
         """Add optional metadata fields if present."""
         self._add_title_and_description(metadata, doc_map, metadata_map)
         self._add_content_categorization(metadata, metadata_map)
@@ -484,7 +591,12 @@ class R2RStorage(BaseStorage):
         self._add_processing_fields(metadata, metadata_map)
         self._add_quality_scores(metadata, metadata_map)
 
-    def _add_title_and_description(self, metadata: DocumentMetadata, doc_map: dict[str, object], metadata_map: dict[str, object]) -> None:
+    def _add_title_and_description(
+        self,
+        metadata: DocumentMetadata,
+        doc_map: dict[str, object],
+        metadata_map: dict[str, object],
+    ) -> None:
         """Add title and description fields."""
         if title := (doc_map.get("title") or metadata_map.get("title")):
             metadata["title"] = cast(str | None, title)
@@ -494,7 +606,9 @@ class R2RStorage(BaseStorage):
         elif description := metadata_map.get("description"):
             metadata["description"] = cast(str | None, description)
 
-    def _add_content_categorization(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+    def _add_content_categorization(
+        self, metadata: DocumentMetadata, metadata_map: dict[str, object]
+    ) -> None:
         """Add content categorization fields."""
         if tags := metadata_map.get("tags"):
             metadata["tags"] = [str(tag) for tag in tags] if isinstance(tags, list) else []
@@ -505,7 +619,9 @@ class R2RStorage(BaseStorage):
         if language := metadata_map.get("language"):
             metadata["language"] = str(language)
 
-    def _add_authorship_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+    def _add_authorship_fields(
+        self, metadata: DocumentMetadata, metadata_map: dict[str, object]
+    ) -> None:
         """Add authorship and source information fields."""
         if author := metadata_map.get("author"):
             metadata["author"] = str(author)
@@ -514,7 +630,9 @@ class R2RStorage(BaseStorage):
         if site_name := metadata_map.get("site_name"):
             metadata["site_name"] = str(site_name)
 
-    def _add_structure_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+    def _add_structure_fields(
+        self, metadata: DocumentMetadata, metadata_map: dict[str, object]
+    ) -> None:
         """Add document structure fields."""
         if heading_hierarchy := metadata_map.get("heading_hierarchy"):
             metadata["heading_hierarchy"] = (
@@ -529,7 +647,9 @@ class R2RStorage(BaseStorage):
         if has_links := metadata_map.get("has_links"):
             metadata["has_links"] = bool(has_links)
 
-    def _add_processing_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+    def _add_processing_fields(
+        self, metadata: DocumentMetadata, metadata_map: dict[str, object]
+    ) -> None:
         """Add processing-related metadata fields."""
         if extraction_method := metadata_map.get("extraction_method"):
             metadata["extraction_method"] = str(extraction_method)
@@ -538,7 +658,9 @@ class R2RStorage(BaseStorage):
         if last_modified := metadata_map.get("last_modified"):
             metadata["last_modified"] = _as_datetime(last_modified)
 
-    def _add_quality_scores(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+    def _add_quality_scores(
+        self, metadata: DocumentMetadata, metadata_map: dict[str, object]
+    ) -> None:
         """Add quality score fields with safe float conversion."""
         if readability_score := metadata_map.get("readability_score"):
             try:
@@ -641,7 +763,7 @@ class R2RStorage(BaseStorage):
     async def count(self, *, collection_name: str | None = None) -> int:
         """Get document count in collection."""
         endpoint = self.endpoint
-        client = AsyncClient()
+        client = self._create_http_client()
         try:
             # Get collections and find the count for the specific collection
             response = await client.get(f"{endpoint}/v3/collections")
@@ -662,6 +784,9 @@ class R2RStorage(BaseStorage):
         finally:
             await client.aclose()
 
+        # This should never be reached, but satisfies static analyzer
+        return 0
+
     @override
     async def close(self) -> None:
         """Close R2R client."""
@@ -709,7 +834,7 @@ class R2RStorage(BaseStorage):
     async def list_collections(self) -> list[str]:
         """List all available collections."""
         endpoint = self.endpoint
-        client = AsyncClient()
+        client = self._create_http_client()
         try:
             response = await client.get(f"{endpoint}/v3/collections")
             response.raise_for_status()
@@ -726,6 +851,9 @@ class R2RStorage(BaseStorage):
         finally:
             await client.aclose()
 
+        # This should never be reached, but satisfies static analyzer
+        return []
+
     async def list_collections_detailed(self) -> list[dict[str, object]]:
         """List all available collections with detailed information."""
         try:
@@ -789,7 +917,7 @@ class R2RStorage(BaseStorage):
         offset: int = 0,
         *,
         collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
+    ) -> list[DocumentInfo]:
         """
         List documents in R2R with pagination.
 
@@ -802,14 +930,14 @@ class R2RStorage(BaseStorage):
             List of document dictionaries with metadata
         """
         try:
-            documents: list[dict[str, object]] = []
+            documents: list[DocumentInfo] = []
 
             if collection_name:
                 # Get collection ID first
                 collection_id = await self._ensure_collection(collection_name)
                 # Use the collections API to list documents in a specific collection
                 endpoint = self.endpoint
-                client = AsyncClient()
+                client = self._create_http_client()
                 try:
                     params = {"offset": offset, "limit": limit}
                     response = await client.get(
@@ -842,20 +970,19 @@ class R2RStorage(BaseStorage):
                 title = str(doc_map.get("title", "Untitled"))
                 metadata = _as_mapping(doc_map.get("metadata", {}))
 
-                documents.append(
-                    {
-                        "id": doc_id,
-                        "title": title,
-                        "source_url": str(metadata.get("source_url", "")),
-                        "description": str(metadata.get("description", "")),
-                        "content_type": str(metadata.get("content_type", "text/plain")),
-                        "content_preview": str(doc_map.get("content", ""))[:200] + "..."
-                        if doc_map.get("content")
-                        else "",
-                        "word_count": _as_int(metadata.get("word_count", 0)),
-                        "timestamp": str(doc_map.get("created_at", "")),
-                    }
-                )
+                document_info: DocumentInfo = {
+                    "id": doc_id,
+                    "title": title,
+                    "source_url": str(metadata.get("source_url", "")),
+                    "description": str(metadata.get("description", "")),
+                    "content_type": str(metadata.get("content_type", "text/plain")),
+                    "content_preview": str(doc_map.get("content", ""))[:200] + "..."
+                    if doc_map.get("content")
+                    else "",
+                    "word_count": _as_int(metadata.get("word_count", 0)),
+                    "timestamp": str(doc_map.get("created_at", "")),
+                }
+                documents.append(document_info)
 
             return documents
 
diff --git a/ingest_pipeline/storage/types.py b/ingest_pipeline/storage/types.py
new file mode 100644
index 0000000..5e5a4f4
--- /dev/null
+++ b/ingest_pipeline/storage/types.py
@@ -0,0 +1,22 @@
+"""Shared types for storage adapters."""
+
+from typing import TypedDict
+
+
+class CollectionSummary(TypedDict):
+    """Collection metadata for describe_collections."""
+    name: str
+    count: int
+    size_mb: float
+
+
+class DocumentInfo(TypedDict):
+    """Document information for list_documents."""
+    id: str
+    title: str
+    source_url: str
+    description: str
+    content_type: str
+    content_preview: str
+    word_count: int
+    timestamp: str
\ No newline at end of file
diff --git a/ingest_pipeline/storage/weaviate.py b/ingest_pipeline/storage/weaviate.py
index d856680..2ee92ec 100644
--- a/ingest_pipeline/storage/weaviate.py
+++ b/ingest_pipeline/storage/weaviate.py
@@ -21,6 +21,7 @@ from ..core.exceptions import StorageError
 from ..core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
 from ..utils.vectorizer import Vectorizer
 from .base import BaseStorage
+from .types import CollectionSummary, DocumentInfo
 
 VectorContainer: TypeAlias = Mapping[str, object] | Sequence[object] | None
 
@@ -594,14 +595,14 @@ class WeaviateStorage(BaseStorage):
         except Exception as e:
             raise StorageError(f"Failed to list collections: {e}") from e
 
-    async def describe_collections(self) -> list[dict[str, object]]:
+    async def describe_collections(self) -> list[CollectionSummary]:
         """Return metadata for each Weaviate collection."""
         if not self.client:
             raise StorageError("Weaviate client not initialized")
 
         try:
             client = cast(weaviate.WeaviateClient, self.client)
-            collections: list[dict[str, object]] = []
+            collections: list[CollectionSummary] = []
             for name in client.collections.list_all():
                 collection_obj = client.collections.get(name)
                 if not collection_obj:
@@ -609,13 +610,12 @@ class WeaviateStorage(BaseStorage):
 
                 count = collection_obj.aggregate.over_all(total_count=True).total_count or 0
                 size_mb = count * 0.01
-                collections.append(
-                    {
-                        "name": name,
-                        "count": count,
-                        "size_mb": size_mb,
-                    }
-                )
+                collection_summary: CollectionSummary = {
+                    "name": name,
+                    "count": count,
+                    "size_mb": size_mb,
+                }
+                collections.append(collection_summary)
 
             return collections
         except Exception as e:
@@ -812,7 +812,7 @@ class WeaviateStorage(BaseStorage):
         offset: int = 0,
         *,
         collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
+    ) -> list[DocumentInfo]:
         """
         List documents in the collection with pagination.
 
@@ -834,7 +834,7 @@ class WeaviateStorage(BaseStorage):
                 limit=limit, offset=offset, return_metadata=["creation_time"]
             )
 
-            documents: list[dict[str, object]] = []
+            documents: list[DocumentInfo] = []
             for obj in response.objects:
                 props = self._coerce_properties(
                     obj.properties,
@@ -853,7 +853,7 @@ class WeaviateStorage(BaseStorage):
                 else:
                     word_count = 0
 
-                doc_info: dict[str, object] = {
+                doc_info: DocumentInfo = {
                     "id": str(obj.uuid),
                     "title": str(props.get("title", "Untitled")),
                     "source_url": str(props.get("source_url", "")),
diff --git a/ingest_pipeline/utils/__pycache__/metadata_tagger.cpython-312.pyc b/ingest_pipeline/utils/__pycache__/metadata_tagger.cpython-312.pyc
index 81989d6997df438ca8414e5b8f62470acb8aafb7..88ac7534937565012f97fe40761b2295782d2c69 100644
GIT binary patch
delta 4340
zcmZ`6ZA@F&^*;MOf7{r`fNdZc65Kd^H4tb*SrQ;5q|Hd0&@Hvvx~|^^OpHzMd*lO=
zxF2lFwsr;GP0Q4Fs#Hx%oBr5@G-)4N)9ufssuh%K(5F_7R8?EG{Xl^qTYv4G`wXEG
zyMpu1Jzw|UbI(2J_`@sj6@4Fgy)FWy{@jOS(T;gv*uGC9<QL@e`KGqwgd^#Yh$^X;
zoHOZE71fq=O}LY8ped?7=b7*(y?{HCKB~~N2$-RM)!74I)s+lvqqzl5Q9ZffM0v7Y
zA{KIjsNPwk`l#)e6*oXgG9;*FK=li1(Ii(0asbFdYTpvB6x4E{hPF|w1hoRFmD{Lc
zL9GI6nA+9IyU|;+FinyX!KnsL%`Hob7QJFg)J~uJF6A-lS%+*W$Fuo#j=v-wPEPyN
zlask@Caq@+`L=PbkT(L4oI5>~>OVa+JTNqz8h+x;fZ^?((#HxcJ1xYFQ19czgQw4)
zO!f|+1ku5P-eUu26O!Q>rFu%Ex}MFCY76g64@y#q-?g+J3&BQM1%gTd8r%nou`obG
z#wDi%gStL>mTHrQyhdA*B!r`=Q4Qd23k!19dY}t$#E{i&MmMaQ&J0`O*>RfDSuIKm
z9TXR)SpYEv0sfJ-Ato3&&A|WGaFnq1Y3`SM`hBWnR))YRQ=Ra2sV?fK9$ZwlOxpp%
ztb}=}t%SjM!~s_?C%xcjKmWem<;VRP)+v@VcNXMt$ouwec_CqCRUp6;2vAhRfQiMx
zC;VS>om9=;N`K{+__v(KRb_Xm0mRpB0RBn-^8)!VYX+1*pgd6ASqHd=E0s#qyiQpv
zH688MuH-Z5^Zr~Gh^_Z{dq9@8AwZjkgI><0^edCpup@Rcoil8L^lYXSa3Dn>_z8Il
z{&|lQytjvhY#y^6IIIJ~0RS2*!dXiJ;Ka2rXLZ<CWT$NjRvh)*0N}jOlQkFdmz#%X
zyMUO0=ztG<0C8WD)!`(DpdJA_i-~jXMywHmh>a%1S`q9AV94T}-oCU(2QFvmB)$mN
zh3xwR3)c~gVFYXVrf12ga$?Ox_O;%1a*M6y%({;#d%u(quE~m0ekWKtcXcV)cvD^q
zHm@l_S+kK~-J7AMK;xPnrw$URx)GZ9t~qh$A}-&C8!!?3VkQ2*RLO^J?A#7#Gvr(r
z-hw!sI3}LZC<DLd^95bJSS^*h{}A1H2n4M>VsEgC*U`;;?LY3_VTt>Uv+tnteO@_&
zGz1;o<ES+a9sz?9KInMz%uYtdW_L2xho%r5gntdQ`47;+t6u-?Dbpu?!m!u5-m{Zo
z%+2PF?__-dxd^_)dt5!{MhEycSJaIWhGRV_@iJ#6f5u_s@43Q7Cs89<D_)mWJC#*M
zqyp;}=GelVkc<Tv5`t^io^*g_6q1Hh^=!#_sdL1p`ev1+OK{5|#W+QZ*)CI}fuw&n
zqa-~}0>ag50L%opOl?>2!jk1+)Cbk0jLOtMVi88Y)H@=p6_A|*YK>Y6-=JCrMa`=!
zKo7&b{ECvO<@4^*{1D`DyPln(g(=<e<Z=@!npY<a*}QJp)05fM1$u>@1OIHjeN5z#
z773=W^%q5%)sZH~t<v|ZG9z7<v<ivnC@02@GA{G^2g{-GigDF8W8<k{1%El<49}1h
z<_IxnETHO<2q?ICeW1Laq%iN9JoyF7jGPbYWm^<w+>d7cn`Z4ZR?rVg{C2R4zxSZy
zdoZ&=fwx|DsIrdPQjDy0)j8u}9#xrfyhh%z%s6!{RAOK->F7!^bgW4xhKXB@@m;vH
zefAmWySB}myZME)_&4RCI@r@PY>ofU%Zr!-OHS>M4P3?|oYiB!XHLez&9TBo%2-yV
zE)?4wrK{<VofgR{or^L0+!WRHSc$Wx7R%;i8qE~)s<vg}8>wx`Ak&`y0+fM#QEwTB
zygqI3qiIH243a2btzjRdX_Yc95n$+6^BD~z$HpMbWGC4focJcFo>tR(IyF&HX^uUH
zL}esbNb5#fX;-PuP%6W|0K;iBh&+T83G<<SEWjeg8Oj(Gq|1g|Q~|Rvv9rKUxXdzw
zn-J@;#}N~|b!>JUhHo=eu}Do(!_TNz$X%rB)-LW*a2pW}<|n|A$S<277A5#^W$_{&
zQu{rC=gCF`3B~x~>yFh(<HwQycgt^{Uuo%EYUx`}^k4U_hT|*YmZfmZ&CGJR{kr_J
zceNt=aYg5iv6Wq&OS?LO;<^)WS&Se0<wJj(x_y3S;Hjm7r<RXAz32$9RyTZHef-U_
zmH6SM_~GUFQJCHC1IC@f-TOc3IJVd@aNYi?yLz>?bFu6AV&{p)=E3VHJ_+qz@+3BF
zq^kNe5BvpIJhe-n+QoR+ZTlyl!F9!2<+?7v;ue{b|Ir_lf(xJd580cXaGZoBQXd-x
z+;FQ@%fOXlr88VwVTxsF3Y(Vm{AhRqdbf>mixlP!ksj&SJQayUWAeku<eukH*9uud
z1P9~{%cab=o{s6j=WUTT=_Y?9+6YRM(F=7KfygcaK>5s$@||y^%rpWlM+t>pKs<+F
z0zn=@0l{$uClEZ!pRSHc{k&LxASW`rsDrpgu{$^x)m1u@p33PAvkGGfFcBHn9L*bw
z1}{%%qGX6z6xGvtuLHpHlkl1$ID)#P2(IzEntrPxrTA#g0r1i5HLa4i@Ij4TiT)IA
z+n}w6h)mc_#aD$Q|93t5Gup6My3P9=#%%pa&My46!R}~9+>oa<%0@fHSU&Rg1|$pi
z5Hj4@6sOE?7aa2#|Hr<A(q0~Gic1gk6HQ&xQGTtd2K?|^)49j+)iBZBU>KWk1~Zu1
zj0)cfFX7S52PnFMB2I-Pu#AfWY(D=+ex$kGFIrY}$H*S#FEk&9#cwz7?>!0x!wu;M
z5)1qSfX3Xz(w9=3IfA_cd@TUr-a9K{W~+Xcx3|Qlm4zo-p0P;R7XHxomE49`{59@y
z$h>HbSoRu%lL#I`@F)TdYj%o%bfD!aakOt=C3_Ls*lHL`u5gJmxN%Hl37>g0*O24X
z()p~Oou(@L3C<mQdQ?ln5!lP9Euw9ZpYJ?n!<LV|#oy_SOYI9woo`vHMH_VA&l=HC
zPDl9sp>n&~bC2@h99)Qti@}Z)vaN9Ep8?k_07~t!=r{SRhoaI2{?4JUqIGC!h+&yZ
zScZl+``ptw5B>i(S2R7MNqrI|8AaemfRSll@Xrww&*ds&A{sF8*;@$qBf!qL?*1kZ
zmu3j?4z#2Ejqd8xd-kr@#8!7TtU2oy7c{~3jd#6(-KmV+I5t1NrXbY@9sAtykEYk`
zICGF-#hgAL-P8zT^INlyT5E&+@7+dFw4>sj)n@-*%m4ClV^KWN6fA9&WeSY8!cP&i
zPuG};<>!HA9u+Fg_7>2GIyMN<k?g2h*DxAI-4RW&Xk5*R7hVzP{C0!;jiaXswQed$
z53|35GPW4n&j74hB}p>K*)NIv3)1if=~yNmUlPw(r1^8wa3|KjNCI=6H_GR`mr48T
zZkUGV=#BpQahQHi>Njk%)G~K)gTQCQS1y&$jcpM4Y&2V>#<|1>fzO7^BGt_~H~6o5
PVr8l<?Y>J8iY)m*a=g^{

delta 3671
zcmaJ@eQXrR72mzP-P`*<-}&SGfqfWbyujTVVvGUDU<@S?FyupR>Z&~-w`=>%-bZKG
z7+=o4Mwr(9K!VI4P!(EL%^yTWY9v=Gs?@ZVs;UyLgyTw>ZPQRiNKK?jCiWjKe>8n>
z)^?3+I@11j=Djy>-n^Oj=KZ?-rwRXEpU=%fd;Q5DM_PAX^+$vS7+t#>OO$y|;T4-E
z4M>Whh?*<w9&iIqP@I}4>mBg&oQ*riDbf_DxK!b`9o2B$fR9n#K=rJl`We*=RG%uY
z$_5zK57fXKYLHR;f<UfVL#|-t5KzOas8qgFb=$GLWQcL9fm3tawoD68*yITPB0t32
z>F@X+`V*;ohS=(OK1eUy<JAEWBSC};0G$Vjk}#dMH-wNtst~FH-nJ1R{oLNsSqTHv
zp=8pAY1a*6iutpnYT6(Xlw_JvoP-g)E8wFUM{|@hkd}sTwK<o2i-+lLN4LiXo^%Yj
zz-%|&E_4P_uW276nze$D7KH6Bt7gk~5&{9zf`Fnr`ac@QO}r;G@ip{sLf^A?xmVm$
zZp1kvz(2TuzQO&AY=bVT1(4mO4*T^84G5bMnh<aji6XEawqj34ShxRXq#>Zw^d5jI
z?tw#I@N(PZpSc8~{vmCXWbcxn6WW-UNi+SC^u1R$SlD!E8E`jSnb{BpZDt^uOyzQU
zBV}arIX#(NZ@>-^A_$vl$<-{f1K2^|a(%aVgC*7}Cvlv-Zb$7%LujRW_a;kWJAKnV
zc4i}m%+QV0Jcnu!&^8?-?-Dv@-WQxYX*uG#nJ;;~eD_9LV>tPlsymU3&`y8s?Y1oJ
zq<{C;xm`fSw)hGCx~GOV_!`SfwIZkv#jZMr9Evz43^-j7Jc^`B5X%n5S%k}}xK(LL
zR6M|SF|Jny3SN<?WR__l=>tiRiv!t+;s-5(RZVMkdWR(CKoCTI5ZxfA28L`*say4e
zF(C+opi--Z;a{OtssY8VIDuXT<IsdtuA>e9;kfD5v}{t%DTRC{XQY>N58EXs1spHF
z2|<00EAgW|tq3$hI$LffTZv09rwQ1LO|fhCNjv-<nj<SrIv~f{6hRZS&Pf4tT*+bJ
zWnk_0vX)T{zIE;Y(`aqLQ!f@h95*R~PN5{O=$dqv?4wm+V>s+wp<UqhDxO=Rm!&my
z8`$TXl)x>X3_s~ANkme-CFzIUO<T#O_`1O=qh`f415*QQihm_FPP$=zw-PA1-U+VK
zJO;))YX$~AYbB4xhbRV@VeVmV!Y)@7DeVu^@)JHm(3Sl%Z#vGTj1l;Iw0ufQDtSZA
zoi94#fTri<$y3SRGslxJ9{sZEKYiwCfA8_tF<12V<#Qly#9o~!sKsEaP|z}I7TSqX
zJ)bK&534DnlBntH9WzGqBvWKe(^Kx%CvxdNEd!H>E#vwR$u`qzWU^|0%rKoJYD!Uw
zE(cAKKpM#uNH55d!vLl&uba*S7_DW_l4D2_Evv~3IFORbp^T;`lcrdJ<#UE94y(8+
z(+U5S0dGKA7%_~(1p?7x<vY>`J=tsJ<|9bOmB>p7xWck#P?E%jO+INlQ-w_OoH{{H
z1K$j;*-@XC(sk2KQsc=q+oFzH7jpb+vq82W54DzYRsB7HZ*mI}u6FDF$d1{_j$3_m
zk@jiF_kHtKb?|d9ikvI-ffRitwLTWP%E%3g_S_G*&4%0VhZD2m#QkvRY`F7I^=$ay
zwDiDRb6uMAZl2~JhAOYgSLN%c=0e-w51qbs_Gg*5Gxxe)n2R5W;U8X}b`CrYZ@#x>
z&%IFRwDW-{G%vTmTl22#-nRYI$F7{7^|maDT*H>P_S}li)py;KA`hyz-cs%y`*YQi
zY4=~N>uwypbz-i1@3iBxho!)NQ&RHju`GH#On23V;RT+#6yE3bNw7niXGxCiqj&2z
z@h{Sk>t^@>y;&dQ!}M-_H~#}FHMH{8G|^DlJPPur9TEh~ns7C3<LQ;B9#|wxf77s=
zzd;upwp#hp2Gi6{B#+DjTg<ej|98rsn<$_o;L9QlM8Up_Fob}2k&GbhMd(84rq0GF
z-$C0NJIX9qvnLHrWY(E(T{RSSC^e=T1alZUhk%*Pv}<b46m*CRgRn<{-M1*RTt_dY
z)dIeP1k=3iv#wqe`eYDc9KfvX%M<m;vQtl~^e>I=0vP}f^*42Z<NBK7{O}BEatd|d
zLU|EF5R$7bTH3yiiUuidK_~yVrH%hN{iJ0?>_GC_nb)>DCD_+stft0v7!bjx2ctG=
z)kol*!}M~ji{C<jA8X}z(obWZjk{oGvHE!Kd`inG(X6WLsbMublqcDgK{{w}{FRsR
zN)uLKtOhK>YQn09nA?~Gao1M-;gd=(ATS@X7n{AeR@p!w#dil;&1Bh)f`fEhq6cgm
zO6=ly(d&t(&6j|zV+FVxV=Eo2vO7=DbXCz$6BYd3na>l0Hhz3&aQ7oe0?+wle9!x>
z)7}SNLJ{^O96-R-Oz;kq=c%zb_Eoltr_YnTj%+m86tw)fO5oTrYsr4=B-m-X^i(cm
zWQwXnE~2Dlq=xk*qzN*Gv)Pr~NB_O|q!`BW4KTTtZ=D(M`l+oOU$Uo4UR2<QY6_xF
zCCOy5_7vncC1s>uO$`sLB>rF4SLo>jGsoDuV9h7nER*g)U&l89YfseX!YLOr1}KYc
zpp0>nw6D9fY%BUPf9_8t;5CnHsk6nZp$t*S^W>bK7}m0}j>4W;Dnkf9J+iI8AJ+6i
zmmI=z_}O(TE4`Xg@@oiqE(9;Obu%tw4??iak@MJP_b7_J8wkHZ_$2~!7Dl*r_J^>C
zfCs4upcKI3?F$e66&Fv<d;Awq%zNwS9Q6wlw<$JXwezvFS?GFLUArK_e?jDe;YFk@
zoZz{m{Bi!Voqp%}_d`rQDwQj(LOVjUJzLAK0mTfYA#CI7N`&hy#K{D(tSzx3oNbfc
z{dQ!q8xNbaEM2#SCsKDduZ(GG5BU{{U@@cX01I}W=O1t{f5dq{<eER^cDBxPJ3r#Q
ukGP#5aLr4igO6S5TH@fh<ahIJS4NgN_$}4ZZyekWRUW_PGY*ku!~Xy=Fd`HH

diff --git a/ingest_pipeline/utils/__pycache__/vectorizer.cpython-312.pyc b/ingest_pipeline/utils/__pycache__/vectorizer.cpython-312.pyc
index cfffc2cac34fe50efc190d33ae43b53069785488..48c83db1be42704311fbe73fccaa4b94db84bad8 100644
GIT binary patch
delta 2327
zcmZuyU2GIp6rS0go!xeS`$K8FyXiuUu(9-qQfQ$?`~L%Mp%m2BFfKc{WtQ2Q<<6AQ
zW@|BM(nO3jV?vD@jqw2ki6%9M2V?Y2V@SHTX3GTwiQtPbL`Y2V#d~Huv>4~%yXTyH
z?z#7#^W8JoJO1eO{_OP@GxW2CZl3;i-dpATj4D@{<MYqg%%=G`&oUw_a<Vh-q@zQ2
zrHkT4)W(ZWxj5~PyG_|8d(z&xH|>l2Oub0<rvvc-m5bvgh(o1SG$<+)-5qokJ@N7l
zHZRz0%m5?$-eN@mH5*mw7vD5x=c0l6_xoLT;^>!@ggk%ywRn^zo(ZH28q#%1nb4*K
ziA+Y8k_lZ>mBy5&Dx_ri*hoz18HtVc#m0oOSB~@%Z`Y)LTE)_|=|;-Cj*ktFj1I-S
z#)hctU|&~n-{|6Ac9I<o(e1A=I$Jmd!(3YvW^B6MvSnGFvt;YI_>k_jY*|~%Wq9n>
zwv^j=(^n?3*Ve*i8G+y6<g?`Uk$Si+jfN?;<n@tynDqjSa&W_@Y^q|zrnCRQDVqwc
zhq9z+Hf2-gmVJHPxG6mrRP#Tdm8bKpW}{`db<EgByIyU1N$d=lwPTM+@k8cgTb9#9
z)*RGdudy^5J_7eRFyqi`En}+AlGewpBg<WPSox<XEVJgO_^8vk%HhxxwvjN?o*q@v
zk)rP$o64YRXE#b<gd@fej`G=9v>bcrGEyvQlA`GeC5bSkm)JEO6OSyX1*C`>RZ?`q
zV``H!7>YvtD18cvBBh{^Rz)OZ*qxNETSY026pfM+Lq19A`pnaS{$^k@?2*Vw!WlG$
zz0?)^!QU}1s|lU>F*-YmG+oeXICWAthWKy~PdE+9<9HJ|x~!K#0vKtkd=80E!$JCq
ze{Cs!GD%etH4P|ee9mWPp^VyX3Ky8iKBhck9GG+6ac{aj{!x0xU4K7R^QkKzY0X7i
zmqUB<q0U^W^G0$x)IHaG>F{dRmV8xnuBw?T!>i$K`EYwK+&<U)ZVZ<3`AB;%(!Lzp
zmk)L2LS5h2E{FOH%W6IeeGn=vG6bjl#Jyl`KG>2Awk!u*e+lltQM%-+T&-<hY3W_s
z+BfIC<qobkv@Y%GUuqp#svn#iSSjC;^F;4gn`djwMcS6D+voguDuVfn?YWBWU-^IB
zyi##=@saZ%mM@}L!)3<fqQ;6HAU0AUEYjd1M<NkiZ?qTJu`P=yi`#7b_QE7jn+YvX
z)Pc<fZD4brLrGo5T46cAra1~R%qUBqCU$6%^}b<e%Zv+w>(v;D`-P3z8kz_v=_sv1
zQ!{-BOZKxDjkiip&H`cZb_#^csFYbItpYe9X-F7Xu|V0VPinXa+@NF_`U~OJQz?2L
zVyD!>a6!VO^OW5pvCF8ywWzyrdh@!)COZWskw(Nt36fD24G~r#MzVAy*iQp!ZVEIV
z)`#n<j$4eIrD68f#Xn2Cxg9Tn<wbyQ3NhRZVjlq93quq<K*6{jI26W1pbi5Zr113W
zV2BytZEljj1aSo52*6Q*Q3_F?nGbvn43G}<QQ<L=o=pQj4z?2jW|3b4>16<TY|-Mi
z1Q?0RaGe0=*8$Ai!t1uK3KfBg-Nr&?n7y?4P31eR2P&^Y!v=yJu6~ZaVd&LA?KCUJ
zCz7(Np(t0_U>p`t0Gx(J@Kb=$bX_V~$9`+P7o3=dHb?w|kWdtrR+KgbO%RBkHWahb
zV8}k+2~M0WQ5pbsFpv><0<-|^1^~ukM1gQRZDhpTozPI<`6S9fP;7_kGXNq$0|32T
zCxc5s1b~!kcPPBg+~V5r`ARMxUUmB}4zK!4FUB5nm5xz%VdiQ!SF`^S1IokQ#$xDe
zuNex~M=P*u=;5uiJXP>E3dBi|0>9w`IsHi$qXuN1Nh=W4ZCXtpY8&nh-OFsgg{}vA
z!WjTRfO+U=Zo)iqb<iM_GCFwxPg5VLkp?__XlGfLFf9+5n!8M0j;Z^d@jPI*Jz$#d
vGOfQcTkb`6EiomRTNlda_boHKR%@wRei<$F%%`aOH-FZ~*8ar+nrZtN{QxEz

delta 2072
zcmZuyYitx%6ux(Nc6RpJ?r!OG*KRG;PN6Rz4U~$McPrf%#0RT!*mkDvl-ZrlohfNI
zyH<lHn}`X`{D4GE{0V_XO!=WP8cB@NXiS$9+D?Krk*YsYj1T<dJ+o|q#QWpB=Y02`
zbI&>V%$=W~z0%|R&gXL@I;y|=e*Da=uf{P>m2<PL_5B!$SY#A7&eGYTIFnqQqZ}(b
z6<5+7cUv;2c#__@H|dM}FtVY8NOZl8ME7MI_(Uk~pJsT^><<U9%?RVy=5F9geBw_`
zPe3}w;>cqC;dX>dhNM!&StP9SqK#_yl7(oe8dK6zJ-VkPXYqvB2smoXA2+5XYs@n1
zd}|IU!vQ0&IT0DiF=wMQt8htI&Q9}VXs+(0C&xf;S-W0cI_C1j;3sNJ%%l1LIit6%
zqBcY0%sHqlChI7<$gx@5M1(GfLaq`wg|&4US^QgN72S`~HX4;D=M=r7PsTYe>m;1$
z&pO{nAK0>-Sk^<s(CbUFOhmzLq&&-A36u&;>k=rfPdoUaAv?%S#y_s>>F)M+MM<_P
ziQ$Y-Rg^?B(LOvTwI;X7h?a@KUBq~7GD8V{oX#FaO^AZ1>Qd@dhH0Z{dJZ2R5PFCD
zgy;7kH~oV{`(wR*YdXq!_o^wnTW>u!ot84?iF8_#M-sX`qo&#?G&PlR?vWBiB2m-V
zJE@PWM9$DvH8oZYIJTR&nND3!O6sI;I>)7iC=rbhnr>N>Q<|PgjYz~r_Yxm~AE1na
zY1edO2BqY%B#LrsOpsDyT9s3}X;U@RnND=-<BB{?g0Pn@CPYG@aDp%@E0Q3XY?=l}
zE!Z&$@-;qVBfDHCqe;prDTjk10N~-FCEX;XX`xIkn9f967EVgjq=v3*5MeYLHR_z{
z?sY(z6y8LC_>s5r?C6E$P0yy4@TUB}GXqOC&2;KtiZtZ+y%)P1uK$o-jP58zcPxav
zjenfsnfokq1#ffFRj%nb7FASV;EY|1q2@xUc`?*p2(>SUx(cDLPbv$c=knaLx9U8%
z;BCm`m0-m=ewIH!un=sy5gfcY{E>V~p5K0Gp{<Xq-yF?5S3(W*joapfU3urSC%D9S
zT&=q5nt!G{fAH*J!Mpx0-?qqi7u<aJms{tLymFI2K6jG)7qcAAg!m1`-Co%QVk-p`
zOB#H4G-c9aeC%G2x6j>jZ?`pWgGH7$0lg01K`etV;GCzV5nUx3X*D{1mAJ(?<m<q(
zxoO`UcI-F)F252s9iz1Q^h-9=*4AM%vMwbxXiw{iF9JJp-gpprea7m54d9YVtF#B8
zEzEL~kTppdRf#}bMxWG3FQthCfQ1dLIy^xGFzxiJ31nol(iFXP(X=a4%IYZIQw-P2
z&z)37NfA<sq-1hL($Z>5lSnf{7#X*MLv{P83k@D9T7l9aEmS9+MsFyBPs|CSJ<Nt@
zf!PJHn?j820dX$?WJbUX*>8MZHPmnr#6tl66xI?4Vt_(sqY<d7HU_IhGuMEN0Sp2R
z0UV*g`w5hV90h=?6hD?1Kzgzo<QQ--0$7*(5=butz?a3lAJu^z2bQLdNF3l*gp9@N
zK&_QN{9;PE!zICn&4#xof@kMiYTm_OxP1*CRcMmywN3bQ<Ja16Tdm7u6C;YMNjy_L
zOax;IU=)lPFrtIn{aCjiUpMUGF<fVy4A*Y8-U2w9Y@}c^icFiJ4|M1~vJ;>aU^4(X
zA|uA9;iraV5QhOa0a)RBK>~oT(r#0D2Q4!@R{Vj}14|zN>Hej%;OW>sroj=%=W`dc
zh5DWM5h(W#V52E=&1bm+2YeYx8oxxIo@t~CebA=U^ik4^%~v*}5~)p^8j;fQ@@d5e
z^jNIbXIk-vv$C>6dNRxhTo2tgsYtuX6!i`j)u6Wb>=@%^v}G05-$9X|karbrs9HrG
SchI)K*o+M~{*C~xeE$P?Na<7n

diff --git a/ingest_pipeline/utils/metadata_tagger.py b/ingest_pipeline/utils/metadata_tagger.py
index 1f00b16..9beb2d2 100644
--- a/ingest_pipeline/utils/metadata_tagger.py
+++ b/ingest_pipeline/utils/metadata_tagger.py
@@ -2,13 +2,17 @@
 
 import json
 from datetime import UTC, datetime
-from typing import Protocol, TypedDict, cast
+from typing import Final, Protocol, TypedDict, cast
 
 import httpx
 
 from ..core.exceptions import IngestionError
 from ..core.models import Document
 
+JSON_CONTENT_TYPE: Final[str] = "application/json"
+AUTHORIZATION_HEADER: Final[str] = "Authorization"
+from ..config import get_settings
+
 
 class HttpResponse(Protocol):
     """Protocol for HTTP response."""
@@ -29,6 +33,15 @@ class AsyncHttpClient(Protocol):
 
     async def aclose(self) -> None: ...
 
+    async def __aenter__(self) -> "AsyncHttpClient": ...
+
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: object | None,
+    ) -> None: ...
+
 
 class LlmResponse(TypedDict):
     """Type for LLM API response structure."""
@@ -66,8 +79,11 @@ class MetadataTagger:
 
     def __init__(
         self,
-        llm_endpoint: str = "http://llm.lab",
-        model: str = "fireworks/glm-4p5-air",
+        llm_endpoint: str | None = None,
+        model: str | None = None,
+        api_key: str | None = None,
+        *,
+        timeout: float | None = None,
     ):
         """
         Initialize metadata tagger.
@@ -75,30 +91,26 @@ class MetadataTagger:
         Args:
             llm_endpoint: LLM API endpoint
             model: Model to use for tagging
+            api_key: Explicit API key override
+            timeout: Optional request timeout override in seconds
         """
-        self.endpoint = llm_endpoint.rstrip('/')
-        self.model = model
+        settings = get_settings()
+        endpoint_value = llm_endpoint or str(settings.llm_endpoint)
+        self.endpoint = endpoint_value.rstrip('/')
+        self.model = model or settings.metadata_model
 
-        # Get API key from environment
-        import os
-        from pathlib import Path
+        resolved_timeout = timeout if timeout is not None else float(settings.request_timeout)
+        resolved_api_key = api_key or settings.get_llm_api_key() or ""
 
-        from dotenv import load_dotenv
-
-        # Load .env from the project root
-        env_path = Path(__file__).parent.parent.parent / ".env"
-        _ = load_dotenv(env_path)
-
-        api_key = os.getenv("LLM_API_KEY") or os.getenv("OPENAI_API_KEY") or ""
-
-        headers = {"Content-Type": "application/json"}
-        if api_key:
-            headers["Authorization"] = f"Bearer {api_key}"
+        headers: dict[str, str] = {"Content-Type": JSON_CONTENT_TYPE}
+        if resolved_api_key:
+            headers[AUTHORIZATION_HEADER] = f"Bearer {resolved_api_key}"
 
         # Create client with proper typing - httpx.AsyncClient implements AsyncHttpClient protocol
-        AsyncClientClass = getattr(httpx, "AsyncClient")
-        raw_client = AsyncClientClass(timeout=60.0, headers=headers)
-        self.client = cast(AsyncHttpClient, raw_client)
+        self.client = cast(
+            AsyncHttpClient,
+            httpx.AsyncClient(timeout=resolved_timeout, headers=headers),
+        )
 
     async def tag_document(
         self, document: Document, custom_instructions: str | None = None
diff --git a/ingest_pipeline/utils/vectorizer.py b/ingest_pipeline/utils/vectorizer.py
index 75a5e14..adc63f6 100644
--- a/ingest_pipeline/utils/vectorizer.py
+++ b/ingest_pipeline/utils/vectorizer.py
@@ -1,7 +1,7 @@
 """Vectorizer utility for generating embeddings."""
 
 from types import TracebackType
-from typing import Self, cast
+from typing import Final, Self, cast
 
 import httpx
 
@@ -9,6 +9,10 @@ from typings import EmbeddingResponse
 
 from ..core.exceptions import VectorizationError
 from ..core.models import StorageConfig, VectorConfig
+from ..config import get_settings
+
+JSON_CONTENT_TYPE: Final[str] = "application/json"
+AUTHORIZATION_HEADER: Final[str] = "Authorization"
 
 
 class Vectorizer:
@@ -25,33 +29,24 @@ class Vectorizer:
         Args:
             config: Configuration with embedding details
         """
+        settings = get_settings()
         if isinstance(config, StorageConfig):
-            # Extract vector config from storage config
-            self.endpoint = "http://llm.lab"
-            self.model = "ollama/bge-m3"
-            self.dimension = 1024
+            # Extract vector config from global settings when storage config is provided
+            self.endpoint = str(settings.llm_endpoint).rstrip("/")
+            self.model = settings.embedding_model
+            self.dimension = settings.embedding_dimension
         else:
-            self.endpoint = str(config.embedding_endpoint)
+            self.endpoint = str(config.embedding_endpoint).rstrip("/")
             self.model = config.model
             self.dimension = config.dimension
 
-        # Get API key from environment
-        import os
-        from pathlib import Path
+        resolved_api_key = settings.get_llm_api_key() or ""
+        headers: dict[str, str] = {"Content-Type": JSON_CONTENT_TYPE}
+        if resolved_api_key:
+            headers[AUTHORIZATION_HEADER] = f"Bearer {resolved_api_key}"
 
-        from dotenv import load_dotenv
-
-        # Load .env from the project root
-        env_path = Path(__file__).parent.parent.parent / ".env"
-        _ = load_dotenv(env_path)
-
-        api_key = os.getenv("LLM_API_KEY") or os.getenv("OPENAI_API_KEY") or ""
-
-        headers = {"Content-Type": "application/json"}
-        if api_key:
-            headers["Authorization"] = f"Bearer {api_key}"
-
-        self.client: httpx.AsyncClient = httpx.AsyncClient(timeout=60.0, headers=headers)
+        timeout_seconds = float(settings.request_timeout)
+        self.client = httpx.AsyncClient(timeout=timeout_seconds, headers=headers)
 
     async def vectorize(self, text: str) -> list[float]:
         """
diff --git a/pyproject.toml b/pyproject.toml
index 75fca2d..a1e1877 100644
--- a/pyproject.toml
+++ b/pyproject.toml
@@ -38,9 +38,9 @@ dev-dependencies = [
     "pytest-cov>=4.1.0",
     "mypy>=1.7.0",
     "ruff>=0.1.0",
-    "basedpyright>=1.31.4",
     "pyrefly>=0.33.0",
     "sourcery>=1.37.0",
+    "pylance>=0.36.0",
 ]
 
 [tool.ruff]
diff --git a/repomix-output.xml b/repomix-output.xml
index a00dd00..afa1c62 100644
--- a/repomix-output.xml
+++ b/repomix-output.xml
@@ -1444,682 +1444,6 @@ class StorageManager:
         return self.has_capability(backend, StorageCapabilities.FULL_FEATURED)
 </file>
 
-<file path="ingest_pipeline/cli/tui/widgets/firecrawl_config.py">
-"""Firecrawl configuration widgets for advanced scraping options."""
-
-from __future__ import annotations
-
-import json
-from typing import cast
-
-from textual.app import ComposeResult
-from textual.containers import Container, Horizontal
-from textual.validation import Integer
-from textual.widgets import Button, Checkbox, Input, Label, Switch, TextArea
-from typing_extensions import override
-
-from ..models import FirecrawlOptions
-
-
-class ScrapeOptionsForm(Container):
-    """Form for configuring Firecrawl scraping options."""
-
-    DEFAULT_CSS = """
-    ScrapeOptionsForm {
-        border: solid $border;
-        background: $surface;
-        padding: 1;
-        height: auto;
-    }
-
-    ScrapeOptionsForm .form-section {
-        margin-bottom: 2;
-        padding: 1;
-        border: solid $border-lighten-1;
-        background: $surface-lighten-1;
-    }
-
-    ScrapeOptionsForm .form-row {
-        layout: horizontal;
-        align-items: center;
-        height: auto;
-        margin-bottom: 1;
-    }
-
-    ScrapeOptionsForm .form-label {
-        width: 30%;
-        min-width: 15;
-        text-align: right;
-        padding-right: 2;
-    }
-
-    ScrapeOptionsForm .form-input {
-        width: 70%;
-    }
-
-    ScrapeOptionsForm .checkbox-row {
-        layout: horizontal;
-        align-items: center;
-        height: 3;
-        margin-bottom: 1;
-    }
-
-    ScrapeOptionsForm .checkbox-label {
-        margin-left: 2;
-    }
-    """
-
-    def __init__(
-        self,
-        *,
-        name: str | None = None,
-        id: str | None = None,
-        classes: str | None = None,
-        disabled: bool = False,
-        markup: bool = True,
-    ) -> None:
-        """Initialize scrape options form."""
-        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose scrape options form."""
-        yield Label("🔧 Scraping Configuration", classes="form-title")
-
-        # Output formats section
-        yield Container(
-            Label("Output Formats", classes="section-title"),
-            Horizontal(
-                Checkbox("Markdown", id="format_markdown", value=True, classes="checkbox"),
-                Label("Markdown", classes="checkbox-label"),
-                classes="checkbox-row",
-            ),
-            Horizontal(
-                Checkbox("HTML", id="format_html", value=False, classes="checkbox"),
-                Label("HTML", classes="checkbox-label"),
-                classes="checkbox-row",
-            ),
-            Horizontal(
-                Checkbox("Screenshot", id="format_screenshot", value=False, classes="checkbox"),
-                Label("Screenshot", classes="checkbox-label"),
-                classes="checkbox-row",
-            ),
-            classes="form-section",
-        )
-
-        # Content filtering section
-        yield Container(
-            Label("Content Filtering", classes="section-title"),
-            Horizontal(
-                Label("Only Main Content:", classes="form-label"),
-                Switch(id="only_main_content", value=True, classes="form-input"),
-                classes="form-row",
-            ),
-            Horizontal(
-                Label("Include Tags:", classes="form-label"),
-                Input(
-                    placeholder="p, div, article (comma-separated)",
-                    id="include_tags",
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            Horizontal(
-                Label("Exclude Tags:", classes="form-label"),
-                Input(
-                    placeholder="nav, footer, script (comma-separated)",
-                    id="exclude_tags",
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            classes="form-section",
-        )
-
-        # Performance settings section
-        yield Container(
-            Label("Performance Settings", classes="section-title"),
-            Horizontal(
-                Label("Wait Time (ms):", classes="form-label"),
-                Input(
-                    placeholder="0",
-                    id="wait_for",
-                    validators=[Integer(minimum=0, maximum=30000)],
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            classes="form-section",
-        )
-
-    def get_scrape_options(self) -> dict[str, object]:
-        """Get scraping options from form."""
-        # Collect formats
-        formats = []
-        if self.query_one("#format_markdown", Checkbox).value:
-            formats.append("markdown")
-        if self.query_one("#format_html", Checkbox).value:
-            formats.append("html")
-        if self.query_one("#format_screenshot", Checkbox).value:
-            formats.append("screenshot")
-        options: dict[str, object] = {
-            "formats": formats,
-            "only_main_content": self.query_one(
-                "#only_main_content", Switch
-            ).value,
-        }
-        include_tags_input = self.query_one("#include_tags", Input).value
-        if include_tags_input.strip():
-            options["include_tags"] = [tag.strip() for tag in include_tags_input.split(",")]
-
-        exclude_tags_input = self.query_one("#exclude_tags", Input).value
-        if exclude_tags_input.strip():
-            options["exclude_tags"] = [tag.strip() for tag in exclude_tags_input.split(",")]
-
-        # Performance
-        wait_for_input = self.query_one("#wait_for", Input).value
-        if wait_for_input.strip():
-            try:
-                options["wait_for"] = int(wait_for_input)
-            except ValueError:
-                pass
-
-        return options
-
-    def set_scrape_options(self, options: dict[str, object]) -> None:
-        """Set form values from options."""
-        # Set formats
-        formats = options.get("formats", ["markdown"])
-        formats_list = formats if isinstance(formats, list) else []
-        self.query_one("#format_markdown", Checkbox).value = "markdown" in formats_list
-        self.query_one("#format_html", Checkbox).value = "html" in formats_list
-        self.query_one("#format_screenshot", Checkbox).value = "screenshot" in formats_list
-
-        # Set content filtering
-        main_content_val = options.get("only_main_content", True)
-        self.query_one("#only_main_content", Switch).value = bool(main_content_val)
-
-        if include_tags := options.get("include_tags", []):
-            include_list = include_tags if isinstance(include_tags, list) else []
-            self.query_one("#include_tags", Input).value = ", ".join(str(tag) for tag in include_list)
-
-        if exclude_tags := options.get("exclude_tags", []):
-            exclude_list = exclude_tags if isinstance(exclude_tags, list) else []
-            self.query_one("#exclude_tags", Input).value = ", ".join(str(tag) for tag in exclude_list)
-
-        # Set performance
-        wait_for = options.get("wait_for")
-        if wait_for is not None:
-            self.query_one("#wait_for", Input).value = str(wait_for)
-
-
-class MapOptionsForm(Container):
-    """Form for configuring site mapping options."""
-
-    DEFAULT_CSS = """
-    MapOptionsForm {
-        border: solid $border;
-        background: $surface;
-        padding: 1;
-        height: auto;
-    }
-
-    MapOptionsForm .form-section {
-        margin-bottom: 2;
-        padding: 1;
-        border: solid $border-lighten-1;
-        background: $surface-lighten-1;
-    }
-
-    MapOptionsForm .form-row {
-        layout: horizontal;
-        align-items: center;
-        height: auto;
-        margin-bottom: 1;
-    }
-
-    MapOptionsForm .form-label {
-        width: 30%;
-        min-width: 15;
-        text-align: right;
-        padding-right: 2;
-    }
-
-    MapOptionsForm .form-input {
-        width: 70%;
-    }
-    """
-
-    def __init__(
-        self,
-        *,
-        name: str | None = None,
-        id: str | None = None,
-        classes: str | None = None,
-        disabled: bool = False,
-        markup: bool = True,
-    ) -> None:
-        """Initialize map options form."""
-        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose map options form."""
-        yield Label("🗺️ Site Mapping Configuration", classes="form-title")
-
-        # Discovery settings section
-        yield Container(
-            Label("Discovery Settings", classes="section-title"),
-            Horizontal(
-                Label("Search Pattern:", classes="form-label"),
-                Input(
-                    placeholder="docs, api, guide (optional)",
-                    id="search_pattern",
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            Horizontal(
-                Label("Include Subdomains:", classes="form-label"),
-                Switch(id="include_subdomains", value=False, classes="form-input"),
-                classes="form-row",
-            ),
-            classes="form-section",
-        )
-
-        # Limits section
-        yield Container(
-            Label("Crawling Limits", classes="section-title"),
-            Horizontal(
-                Label("Max Pages:", classes="form-label"),
-                Input(
-                    placeholder="100",
-                    id="max_pages",
-                    validators=[Integer(minimum=1, maximum=1000)],
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            Horizontal(
-                Label("Max Depth:", classes="form-label"),
-                Input(
-                    placeholder="5",
-                    id="max_depth",
-                    validators=[Integer(minimum=1, maximum=20)],
-                    classes="form-input",
-                ),
-                classes="form-row",
-            ),
-            classes="form-section",
-        )
-
-    def get_map_options(self) -> dict[str, object]:
-        """Get mapping options from form."""
-        options: dict[str, object] = {}
-
-        # Discovery settings
-        search_pattern = self.query_one("#search_pattern", Input).value
-        if search_pattern.strip():
-            options["search"] = search_pattern.strip()
-
-        options["include_subdomains"] = self.query_one("#include_subdomains", Switch).value
-
-        # Limits
-        max_pages_input = self.query_one("#max_pages", Input).value
-        if max_pages_input.strip():
-            try:
-                options["limit"] = int(max_pages_input)
-            except ValueError:
-                pass
-
-        max_depth_input = self.query_one("#max_depth", Input).value
-        if max_depth_input.strip():
-            try:
-                options["max_depth"] = int(max_depth_input)
-            except ValueError:
-                pass
-
-        return options
-
-    def set_map_options(self, options: dict[str, object]) -> None:
-        """Set form values from options."""
-        if search := options.get("search"):
-            self.query_one("#search_pattern", Input).value = str(search)
-
-        subdomains_val = options.get("include_subdomains", False)
-        self.query_one("#include_subdomains", Switch).value = bool(subdomains_val)
-
-        # Set limits
-        limit = options.get("limit")
-        if limit is not None:
-            self.query_one("#max_pages", Input).value = str(limit)
-
-        max_depth = options.get("max_depth")
-        if max_depth is not None:
-            self.query_one("#max_depth", Input).value = str(max_depth)
-
-
-class ExtractOptionsForm(Container):
-    """Form for configuring data extraction options."""
-
-    DEFAULT_CSS = """
-    ExtractOptionsForm {
-        border: solid $border;
-        background: $surface;
-        padding: 1;
-        height: auto;
-    }
-
-    ExtractOptionsForm .form-section {
-        margin-bottom: 2;
-        padding: 1;
-        border: solid $border-lighten-1;
-        background: $surface-lighten-1;
-    }
-
-    ExtractOptionsForm .form-row {
-        layout: horizontal;
-        align-items: start;
-        height: auto;
-        margin-bottom: 1;
-    }
-
-    ExtractOptionsForm .form-label {
-        width: 30%;
-        min-width: 15;
-        text-align: right;
-        padding-right: 2;
-        padding-top: 1;
-    }
-
-    ExtractOptionsForm .form-input {
-        width: 70%;
-    }
-
-    ExtractOptionsForm .text-area {
-        height: 6;
-    }
-    """
-
-    def __init__(
-        self,
-        *,
-        name: str | None = None,
-        id: str | None = None,
-        classes: str | None = None,
-        disabled: bool = False,
-        markup: bool = True,
-    ) -> None:
-        """Initialize extract options form."""
-        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose extract options form."""
-        yield Label("🎯 Data Extraction Configuration", classes="form-title")
-
-        # Extraction prompt section
-        yield Container(
-            Label("AI-Powered Extraction", classes="section-title"),
-            Horizontal(
-                Label("Custom Prompt:", classes="form-label"),
-                TextArea(
-                    placeholder="Extract product names, prices, and descriptions...",
-                    id="extract_prompt",
-                    classes="form-input text-area",
-                ),
-                classes="form-row",
-            ),
-            classes="form-section",
-        )
-
-        # Schema definition section
-        yield Container(
-            Label("Structured Schema (JSON)", classes="section-title"),
-            Horizontal(
-                Label("Schema Definition:", classes="form-label"),
-                TextArea(
-                    placeholder='{"product_name": "string", "price": "number", "description": "string"}',
-                    id="extract_schema",
-                    classes="form-input text-area",
-                ),
-                classes="form-row",
-            ),
-            Container(
-                Label("💡 Tip: Define the structure of data you want to extract"),
-                classes="help-text",
-            ),
-            classes="form-section",
-        )
-
-        # Schema presets
-        yield Container(
-            Label("Quick Presets", classes="section-title"),
-            Horizontal(
-                Button("📄 Article", id="preset_article", variant="default"),
-                Button("🛍️ Product", id="preset_product", variant="default"),
-                Button("👤 Contact", id="preset_contact", variant="default"),
-                Button("📊 Data", id="preset_data", variant="default"),
-                classes="preset-buttons",
-            ),
-            classes="form-section",
-        )
-
-    def get_extract_options(self) -> dict[str, object]:
-        """Get extraction options from form."""
-        options: dict[str, object] = {}
-
-        # Extract prompt
-        prompt = self.query_one("#extract_prompt", TextArea).text
-        if prompt.strip():
-            options["extract_prompt"] = prompt.strip()
-
-        # Extract schema
-        schema_text = self.query_one("#extract_schema", TextArea).text
-        if schema_text.strip():
-            try:
-                schema = json.loads(schema_text)
-                options["extract_schema"] = schema
-            except json.JSONDecodeError:
-                # Invalid JSON, skip schema
-                pass
-
-        return options
-
-    def set_extract_options(self, options: dict[str, object]) -> None:
-        """Set form values from options."""
-        if prompt := options.get("extract_prompt"):
-            self.query_one("#extract_prompt", TextArea).text = str(prompt)
-
-        if schema := options.get("extract_schema"):
-            import json
-
-            self.query_one("#extract_schema", TextArea).text = json.dumps(schema, indent=2)
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle preset button presses."""
-        schema_widget = self.query_one("#extract_schema", TextArea)
-        prompt_widget = self.query_one("#extract_prompt", TextArea)
-
-        if event.button.id == "preset_article":
-            schema_widget.text = """{
-  "title": "string",
-  "author": "string",
-  "date": "string",
-  "content": "string",
-  "tags": ["string"]
-}"""
-            prompt_widget.text = "Extract article title, author, publication date, main content, and associated tags"
-
-        elif event.button.id == "preset_product":
-            schema_widget.text = """{
-  "name": "string",
-  "price": "number",
-  "description": "string",
-  "category": "string",
-  "availability": "string"
-}"""
-            prompt_widget.text = "Extract product name, price, description, category, and availability status"
-
-        elif event.button.id == "preset_contact":
-            schema_widget.text = """{
-  "name": "string",
-  "email": "string",
-  "phone": "string",
-  "company": "string",
-  "position": "string"
-}"""
-            prompt_widget.text = "Extract contact information including name, email, phone, company, and position"
-
-        elif event.button.id == "preset_data":
-            schema_widget.text = """{
-  "metrics": [{"name": "string", "value": "number", "unit": "string"}],
-  "tables": [{"headers": ["string"], "rows": [["string"]]}]
-}"""
-            prompt_widget.text = "Extract numerical data, metrics, and tabular information"
-
-
-class FirecrawlConfigWidget(Container):
-    """Complete Firecrawl configuration widget with tabbed interface."""
-
-    DEFAULT_CSS = """
-    FirecrawlConfigWidget {
-        border: solid $border;
-        background: $surface;
-        height: 100%;
-        padding: 1;
-    }
-
-    FirecrawlConfigWidget .config-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-        margin: -1 -1 1 -1;
-    }
-
-    FirecrawlConfigWidget .tab-buttons {
-        dock: top;
-        height: 3;
-        layout: horizontal;
-        margin-bottom: 1;
-    }
-
-    FirecrawlConfigWidget .tab-button {
-        width: 1fr;
-        margin-right: 1;
-    }
-
-    FirecrawlConfigWidget .tab-content {
-        height: 1fr;
-        overflow: auto;
-    }
-
-    FirecrawlConfigWidget .actions {
-        dock: bottom;
-        height: 3;
-        layout: horizontal;
-        align: center;
-        margin-top: 1;
-    }
-    """
-
-    def __init__(
-        self,
-        *,
-        name: str | None = None,
-        id: str | None = None,
-        classes: str | None = None,
-        disabled: bool = False,
-        markup: bool = True,
-    ) -> None:
-        """Initialize Firecrawl config widget."""
-        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
-        self.current_tab = "scrape"
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose config widget layout."""
-        yield Container(
-            Label("🔥 Firecrawl Configuration", classes="config-header"),
-            Horizontal(
-                Button("🔧 Scraping", id="tab_scrape", variant="primary", classes="tab-button"),
-                Button("🗺️ Mapping", id="tab_map", variant="default", classes="tab-button"),
-                Button("🎯 Extraction", id="tab_extract", variant="default", classes="tab-button"),
-                classes="tab-buttons",
-            ),
-            Container(
-                ScrapeOptionsForm(id="scrape_form"),
-                classes="tab-content",
-            ),
-            Horizontal(
-                Button("📋 Load Preset", id="load_preset", variant="default"),
-                Button("💾 Save Preset", id="save_preset", variant="default"),
-                Button("🔄 Reset", id="reset_config", variant="default"),
-                classes="actions",
-            ),
-        )
-
-    def on_mount(self) -> None:
-        """Initialize widget."""
-        self.show_tab("scrape")
-
-    def show_tab(self, tab_name: str) -> None:
-        """Show specific configuration tab."""
-        self.current_tab = tab_name
-
-        # Update button states
-        for tab in ["scrape", "map", "extract"]:
-            button = self.query_one(f"#tab_{tab}", Button)
-            button.variant = "primary" if tab == tab_name else "default"
-        # Update tab content
-        content_container = self.query_one(".tab-content", Container)
-        content_container.remove_children()
-
-        if tab_name == "extract":
-            content_container.mount(ExtractOptionsForm(id="extract_form"))
-        elif tab_name == "map":
-            content_container.mount(MapOptionsForm(id="map_form"))
-        elif tab_name == "scrape":
-            content_container.mount(ScrapeOptionsForm(id="scrape_form"))
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle button presses."""
-        if event.button.id and event.button.id.startswith("tab_"):
-            tab_name = event.button.id[4:]  # Remove "tab_" prefix
-            self.show_tab(tab_name)
-
-    def get_all_options(self) -> FirecrawlOptions:
-        """Get all configuration options."""
-        options: FirecrawlOptions = {}
-
-        # Try to get options from currently mounted form
-        if self.current_tab == "scrape":
-            try:
-                form = self.query_one("#scrape_form", ScrapeOptionsForm)
-                scrape_opts = form.get_scrape_options()
-                options.update(cast(FirecrawlOptions, scrape_opts))
-            except Exception:
-                pass
-        elif self.current_tab == "map":
-            try:
-                map_form = self.query_one("#map_form", MapOptionsForm)
-                map_opts = map_form.get_map_options()
-                options.update(cast(FirecrawlOptions, map_opts))
-            except Exception:
-                pass
-        elif self.current_tab == "extract":
-            try:
-                extract_form = self.query_one("#extract_form", ExtractOptionsForm)
-                extract_opts = extract_form.get_extract_options()
-                options.update(cast(FirecrawlOptions, extract_opts))
-            except Exception:
-                pass
-
-        return options
-</file>
-
 <file path="ingest_pipeline/cli/tui/widgets/indicators.py">
 """Status indicators and progress bars with enhanced visual feedback."""
 
@@ -2212,906 +1536,6 @@ class EnhancedProgressBar(Static):
             status_display.update(f"🚀 {self.status_text}")
 </file>
 
-<file path="ingest_pipeline/cli/tui/widgets/r2r_widgets.py">
-"""R2R-specific widgets for chunk viewing and entity visualization."""
-
-from __future__ import annotations
-
-from typing import Any
-
-from textual import work
-from textual.app import ComposeResult
-from textual.containers import Container, Horizontal, Vertical, VerticalScroll
-from textual.widgets import Button, DataTable, Label, Markdown, ProgressBar, Static, Tree
-from typing_extensions import override
-
-from ....storage.r2r.storage import R2RStorage
-from ..models import ChunkInfo, EntityInfo
-
-
-class ChunkViewer(Container):
-    """Widget for viewing document chunks with navigation."""
-
-    DEFAULT_CSS = """
-    ChunkViewer {
-        border: solid $border;
-        background: $surface;
-        height: 100%;
-    }
-
-    ChunkViewer .chunk-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-    }
-
-    ChunkViewer .chunk-navigation {
-        dock: top;
-        height: 3;
-        background: $surface-lighten-1;
-        padding: 1;
-    }
-
-    ChunkViewer .chunk-content {
-        height: 1fr;
-        padding: 1;
-        overflow: auto;
-    }
-
-    ChunkViewer .chunk-footer {
-        dock: bottom;
-        height: 3;
-        background: $surface-darken-1;
-        padding: 1;
-    }
-    """
-
-    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
-        """Initialize chunk viewer."""
-        super().__init__(**kwargs)
-        self.r2r_storage = r2r_storage
-        self.document_id = document_id
-        self.chunks: list[ChunkInfo] = []
-        self.current_chunk_index = 0
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose chunk viewer layout."""
-        yield Container(
-            Static("📄 Document Chunks", classes="chunk-header"),
-            Horizontal(
-                Button("◀ Previous", id="prev_chunk", variant="default"),
-                Static("Chunk 1 of 1", id="chunk_info"),
-                Button("Next ▶", id="next_chunk", variant="default"),
-                classes="chunk-navigation",
-            ),
-            VerticalScroll(
-                Markdown("", id="chunk_content"),
-                classes="chunk-content",
-            ),
-            Container(
-                Static("Loading chunks...", id="chunk_status"),
-                classes="chunk-footer",
-            ),
-        )
-
-    def on_mount(self) -> None:
-        """Initialize chunk viewer."""
-        self.load_chunks()
-
-    @work(exclusive=True)
-    async def load_chunks(self) -> None:
-        """Load document chunks."""
-        try:
-            chunks_data = await self.r2r_storage.get_document_chunks(self.document_id)
-            self.chunks = []
-
-            for chunk_data in chunks_data:
-                chunk_info: ChunkInfo = {
-                    "id": str(chunk_data.get("id", "")),
-                    "document_id": self.document_id,
-                    "content": str(chunk_data.get("text", "")),
-                    "start_index": (lambda si: int(si) if isinstance(si, (int, str)) else 0)(chunk_data.get("start_index", 0)),
-                    "end_index": (lambda ei: int(ei) if isinstance(ei, (int, str)) else 0)(chunk_data.get("end_index", 0)),
-                    "metadata": (
-                        dict(metadata_val) if (metadata_val := chunk_data.get("metadata")) and isinstance(metadata_val, dict) else {}
-                    ),
-                }
-                self.chunks.append(chunk_info)
-
-            if self.chunks:
-                self.current_chunk_index = 0
-                self.update_chunk_display()
-            else:
-                self.query_one("#chunk_status", Static).update("No chunks found")
-
-        except Exception as e:
-            self.query_one("#chunk_status", Static).update(f"Error loading chunks: {e}")
-
-    def update_chunk_display(self) -> None:
-        """Update chunk display with current chunk."""
-        if not self.chunks:
-            return
-
-        chunk = self.chunks[self.current_chunk_index]
-
-        # Update content
-        content_widget = self.query_one("#chunk_content", Markdown)
-        content_widget.update(chunk["content"])
-
-        # Update navigation info
-        chunk_info = self.query_one("#chunk_info", Static)
-        chunk_info.update(f"Chunk {self.current_chunk_index + 1} of {len(self.chunks)}")
-
-        # Update status
-        status_widget = self.query_one("#chunk_status", Static)
-        status_widget.update(
-            f"Chunk {chunk['id']} | "
-            f"Range: {chunk['start_index']}-{chunk['end_index']} | "
-            f"Length: {len(chunk['content'])} chars"
-        )
-
-        # Update button states
-        prev_btn = self.query_one("#prev_chunk", Button)
-        next_btn = self.query_one("#next_chunk", Button)
-        prev_btn.disabled = self.current_chunk_index == 0
-        next_btn.disabled = self.current_chunk_index >= len(self.chunks) - 1
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle button presses."""
-        if event.button.id == "prev_chunk" and self.current_chunk_index > 0:
-            self.current_chunk_index -= 1
-            self.update_chunk_display()
-        elif event.button.id == "next_chunk" and self.current_chunk_index < len(self.chunks) - 1:
-            self.current_chunk_index += 1
-            self.update_chunk_display()
-
-
-class EntityGraph(Container):
-    """Widget for visualizing extracted entities and relationships."""
-
-    DEFAULT_CSS = """
-    EntityGraph {
-        border: solid $border;
-        background: $surface;
-        height: 100%;
-    }
-
-    EntityGraph .entity-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-    }
-
-    EntityGraph .entity-tree {
-        height: 1fr;
-        overflow: auto;
-    }
-
-    EntityGraph .entity-details {
-        dock: bottom;
-        height: 8;
-        background: $surface-lighten-1;
-        padding: 1;
-        border-top: solid $border;
-    }
-    """
-
-    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
-        """Initialize entity graph."""
-        super().__init__(**kwargs)
-        self.r2r_storage = r2r_storage
-        self.document_id = document_id
-        self.entities: list[EntityInfo] = []
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose entity graph layout."""
-        yield Container(
-            Static("🕸️ Entity Graph", classes="entity-header"),
-            Tree("Entities", id="entity_tree", classes="entity-tree"),
-            VerticalScroll(
-                Label("Entity Details"),
-                Static("Select an entity to view details", id="entity_details"),
-                classes="entity-details",
-            ),
-        )
-
-    def on_mount(self) -> None:
-        """Initialize entity graph."""
-        self.load_entities()
-
-    @work(exclusive=True)
-    async def load_entities(self) -> None:
-        """Load entities from document."""
-        try:
-            entities_data = await self.r2r_storage.extract_entities(self.document_id)
-            self.entities = []
-
-            # Parse entities from R2R response
-            entities_list = entities_data.get("entities", [])
-            if not isinstance(entities_list, list):
-                entities_list = []
-            for entity_data in entities_list:
-                entity_info: EntityInfo = {
-                    "id": str(entity_data.get("id", "")),
-                    "name": str(entity_data.get("name", "")),
-                    "type": str(entity_data.get("type", "unknown")),
-                    "confidence": float(entity_data.get("confidence", 0.0)),
-                    "metadata": dict(entity_data.get("metadata", {})),
-                }
-                self.entities.append(entity_info)
-
-            self.populate_entity_tree()
-
-        except Exception as e:
-            details_widget = self.query_one("#entity_details", Static)
-            details_widget.update(f"Error loading entities: {e}")
-
-    def populate_entity_tree(self) -> None:
-        """Populate the entity tree."""
-        tree = self.query_one("#entity_tree", Tree)
-        tree.clear()
-
-        if not self.entities:
-            tree.root.add_leaf("No entities found")
-            return
-
-        # Group entities by type
-        entities_by_type: dict[str, list[EntityInfo]] = {}
-        for entity in self.entities:
-            entity_type = entity["type"]
-            if entity_type not in entities_by_type:
-                entities_by_type[entity_type] = []
-            entities_by_type[entity_type].append(entity)
-
-        # Add entities to tree grouped by type
-        for entity_type, type_entities in entities_by_type.items():
-            type_node = tree.root.add(f"{entity_type.title()} ({len(type_entities)})")
-            for entity in type_entities:
-                confidence_pct = int(entity["confidence"] * 100)
-                entity_node = type_node.add_leaf(f"{entity['name']} ({confidence_pct}%)")
-                entity_node.data = entity
-
-        tree.root.expand()
-
-    def on_tree_node_selected(self, event: Tree.NodeSelected[EntityInfo]) -> None:
-        """Handle entity selection."""
-        if hasattr(event.node, "data") and event.node.data:
-            entity = event.node.data
-            self.show_entity_details(entity)
-
-    def show_entity_details(self, entity: EntityInfo) -> None:
-        """Show detailed information about an entity."""
-        details_widget = self.query_one("#entity_details", Static)
-
-        details_text = f"""**Entity:** {entity['name']}
-**Type:** {entity['type']}
-**Confidence:** {entity['confidence']:.2%}
-**ID:** {entity['id']}
-
-**Metadata:**
-"""
-        for key, value in entity["metadata"].items():
-            details_text += f"- **{key}:** {value}\n"
-
-        details_widget.update(details_text)
-
-
-class CollectionStats(Container):
-    """Widget for showing R2R-specific collection statistics."""
-
-    DEFAULT_CSS = """
-    CollectionStats {
-        border: solid $border;
-        background: $surface;
-        height: 100%;
-        padding: 1;
-    }
-
-    CollectionStats .stats-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-        margin: -1 -1 1 -1;
-    }
-
-    CollectionStats .stats-grid {
-        layout: grid;
-        grid-size: 2;
-        grid-columns: 1fr 1fr;
-        grid-gutter: 1;
-        height: auto;
-    }
-
-    CollectionStats .stat-card {
-        background: $surface-lighten-1;
-        border: solid $border;
-        padding: 1;
-        height: auto;
-    }
-
-    CollectionStats .stat-value {
-        color: $primary;
-        text-style: bold;
-        text-align: center;
-    }
-
-    CollectionStats .stat-label {
-        color: $text-muted;
-        text-align: center;
-        margin-top: 1;
-    }
-
-    CollectionStats .progress-section {
-        margin-top: 2;
-    }
-    """
-
-    def __init__(self, r2r_storage: R2RStorage, collection_name: str, **kwargs: Any) -> None:
-        """Initialize collection stats."""
-        super().__init__(**kwargs)
-        self.r2r_storage = r2r_storage
-        self.collection_name = collection_name
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose stats layout."""
-        yield Container(
-            Static(f"📊 {self.collection_name} Statistics", classes="stats-header"),
-            Container(
-                Container(
-                    Static("0", id="document_count", classes="stat-value"),
-                    Static("Documents", classes="stat-label"),
-                    classes="stat-card",
-                ),
-                Container(
-                    Static("0", id="chunk_count", classes="stat-value"),
-                    Static("Chunks", classes="stat-label"),
-                    classes="stat-card",
-                ),
-                Container(
-                    Static("0", id="entity_count", classes="stat-value"),
-                    Static("Entities", classes="stat-label"),
-                    classes="stat-card",
-                ),
-                Container(
-                    Static("0 MB", id="storage_size", classes="stat-value"),
-                    Static("Storage Used", classes="stat-label"),
-                    classes="stat-card",
-                ),
-                classes="stats-grid",
-            ),
-            Container(
-                Label("Processing Progress"),
-                ProgressBar(id="processing_progress", total=100, show_eta=False),
-                Static("Idle", id="processing_status"),
-                classes="progress-section",
-            ),
-        )
-
-    def on_mount(self) -> None:
-        """Initialize stats display."""
-        self.refresh_stats()
-
-    @work(exclusive=True)
-    async def refresh_stats(self) -> None:
-        """Refresh collection statistics."""
-        try:
-            # Get basic document count
-            doc_count = await self.r2r_storage.count(collection_name=self.collection_name)
-            self.query_one("#document_count", Static).update(str(doc_count))
-
-            # Estimate other stats (these would need real implementation)
-            estimated_chunks = doc_count * 5  # Rough estimate
-            estimated_entities = doc_count * 10  # Rough estimate
-            estimated_size_mb = doc_count * 0.05  # Rough estimate
-
-            self.query_one("#chunk_count", Static).update(str(estimated_chunks))
-            self.query_one("#entity_count", Static).update(str(estimated_entities))
-            self.query_one("#storage_size", Static).update(f"{estimated_size_mb:.1f} MB")
-
-            # Update progress (would be real-time in actual implementation)
-            progress_bar = self.query_one("#processing_progress", ProgressBar)
-            progress_bar.progress = 100  # Assume complete for now
-
-            status_widget = self.query_one("#processing_status", Static)
-            status_widget.update("All documents processed")
-
-        except Exception as e:
-            self.query_one("#processing_status", Static).update(f"Error: {e}")
-
-
-class DocumentOverview(Container):
-    """Widget for comprehensive document overview and statistics."""
-
-    DEFAULT_CSS = """
-    DocumentOverview {
-        layout: vertical;
-        height: 100%;
-    }
-
-    DocumentOverview .overview-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-    }
-
-    DocumentOverview .overview-content {
-        height: 1fr;
-        layout: horizontal;
-    }
-
-    DocumentOverview .overview-left {
-        width: 50%;
-        padding: 1;
-    }
-
-    DocumentOverview .overview-right {
-        width: 50%;
-        padding: 1;
-    }
-
-    DocumentOverview .info-table {
-        height: auto;
-        margin-bottom: 2;
-    }
-    """
-
-    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
-        """Initialize document overview."""
-        super().__init__(**kwargs)
-        self.r2r_storage = r2r_storage
-        self.document_id = document_id
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose overview layout."""
-        yield Container(
-            Static("📋 Document Overview", classes="overview-header"),
-            Horizontal(
-                Vertical(
-                    Label("Document Information"),
-                    DataTable[str](id="doc_info_table", classes="info-table"),
-                    Label("Processing Statistics"),
-                    DataTable[str](id="stats_table", classes="info-table"),
-                    classes="overview-left",
-                ),
-                Vertical(
-                    ChunkViewer(self.r2r_storage, self.document_id),
-                    classes="overview-right",
-                ),
-                classes="overview-content",
-            ),
-        )
-
-    def on_mount(self) -> None:
-        """Initialize overview."""
-        self.load_overview()
-
-    @work(exclusive=True)
-    async def load_overview(self) -> None:
-        """Load comprehensive document overview."""
-        try:
-            overview_data = await self.r2r_storage.get_document_overview(self.document_id)
-
-            # Populate document info table
-            doc_table = self.query_one("#doc_info_table", DataTable)
-            doc_table.add_columns("Property", "Value")
-
-            document_info_raw = overview_data.get("document", {})
-            document_info = document_info_raw if isinstance(document_info_raw, dict) else {}
-            doc_table.add_row("ID", str(document_info.get("id", "N/A")))
-            doc_table.add_row("Title", str(document_info.get("title", "N/A")))
-            doc_table.add_row("Created", str(document_info.get("created_at", "N/A")))
-            doc_table.add_row("Modified", str(document_info.get("updated_at", "N/A")))
-
-            # Populate stats table
-            stats_table = self.query_one("#stats_table", DataTable)
-            stats_table.add_columns("Metric", "Count")
-
-            chunk_count = overview_data.get("chunk_count", 0)
-            stats_table.add_row("Chunks", str(chunk_count))
-            stats_table.add_row("Characters", str(len(str(document_info.get("content", "")))))
-
-        except Exception as e:
-            # Handle error by showing minimal info
-            doc_table = self.query_one("#doc_info_table", DataTable)
-            doc_table.add_columns("Property", "Value")
-            doc_table.add_row("Error", str(e))
-</file>
-
-<file path="ingest_pipeline/cli/tui/layouts.py">
-"""Responsive layout system for TUI applications."""
-
-from __future__ import annotations
-
-from typing import Any
-
-from textual.app import ComposeResult
-from textual.containers import Container, VerticalScroll
-from textual.widgets import Static
-from typing_extensions import override
-
-
-class ResponsiveGrid(Container):
-    """Grid that auto-adjusts based on terminal size."""
-
-    DEFAULT_CSS = """
-    ResponsiveGrid {
-        layout: grid;
-        grid-size: 1;
-        grid-columns: 1fr;
-        grid-rows: auto;
-        grid-gutter: 1;
-        padding: 1;
-    }
-
-    ResponsiveGrid.two-column {
-        grid-size: 2;
-        grid-columns: 1fr 1fr;
-    }
-
-    ResponsiveGrid.three-column {
-        grid-size: 3;
-        grid-columns: 1fr 1fr 1fr;
-    }
-
-    ResponsiveGrid.auto-fit {
-        grid-columns: repeat(auto-fit, minmax(20, 1fr));
-    }
-
-    ResponsiveGrid.compact {
-        grid-gutter: 0;
-        padding: 0;
-    }
-    """
-
-    def __init__(
-        self,
-        *children: Any,
-        columns: int = 1,
-        auto_fit: bool = False,
-        compact: bool = False,
-        **kwargs: Any,
-    ) -> None:
-        """Initialize responsive grid."""
-        super().__init__(*children, **kwargs)
-        self.columns = columns
-        self.auto_fit = auto_fit
-        self.compact = compact
-
-    def on_mount(self) -> None:
-        """Apply responsive classes based on configuration."""
-        if self.auto_fit:
-            _ = self.add_class("auto-fit")
-        elif self.columns == 2:
-            _ = self.add_class("two-column")
-        elif self.columns == 3:
-            _ = self.add_class("three-column")
-
-        if self.compact:
-            _ = self.add_class("compact")
-
-    def on_resize(self) -> None:
-        """Adjust layout based on terminal size."""
-        if self.auto_fit:
-            # Let CSS handle auto-fit
-            return
-
-        terminal_width = self.size.width
-        if terminal_width < 60:
-            # Force single column on narrow terminals
-            _ = self.remove_class("two-column", "three-column")
-            self.styles.grid_size_columns = 1
-            self.styles.grid_columns = "1fr"
-        elif terminal_width < 100 and self.columns > 2:
-            # Force two columns on medium terminals
-            _ = self.remove_class("three-column")
-            _ = self.add_class("two-column")
-            self.styles.grid_size_columns = 2
-            self.styles.grid_columns = "1fr 1fr"
-        elif self.columns == 2:
-            _ = self.add_class("two-column")
-        elif self.columns == 3:
-            _ = self.add_class("three-column")
-
-
-class CollapsibleSidebar(Container):
-    """Sidebar that can be collapsed to save space."""
-
-    DEFAULT_CSS = """
-    CollapsibleSidebar {
-        dock: left;
-        width: 25%;
-        min-width: 20;
-        max-width: 40;
-        background: $surface;
-        border-right: solid $border;
-        padding: 1;
-        transition: width 300ms;
-    }
-
-    CollapsibleSidebar.collapsed {
-        width: 3;
-        min-width: 3;
-        overflow: hidden;
-    }
-
-    CollapsibleSidebar.collapsed > * {
-        display: none;
-    }
-
-    CollapsibleSidebar .sidebar-toggle {
-        dock: top;
-        height: 1;
-        background: $primary;
-        color: $text;
-        text-align: center;
-        margin-bottom: 1;
-    }
-
-    CollapsibleSidebar .sidebar-content {
-        height: 1fr;
-        overflow-y: auto;
-    }
-    """
-
-    def __init__(self, *children: Any, collapsed: bool = False, **kwargs: Any) -> None:
-        """Initialize collapsible sidebar."""
-        super().__init__(**kwargs)
-        self.collapsed = collapsed
-        self._children = children
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose sidebar with toggle and content."""
-        yield Static("☰", classes="sidebar-toggle")
-        with VerticalScroll(classes="sidebar-content"):
-            yield from self._children
-
-    def on_mount(self) -> None:
-        """Apply initial collapsed state."""
-        if self.collapsed:
-            _ = self.add_class("collapsed")
-
-    def on_click(self) -> None:
-        """Toggle sidebar when clicked."""
-        self.toggle()
-
-    def toggle(self) -> None:
-        """Toggle sidebar collapsed state."""
-        self.collapsed = not self.collapsed
-        if self.collapsed:
-            _ = self.add_class("collapsed")
-        else:
-            _ = self.remove_class("collapsed")
-
-    def expand_sidebar(self) -> None:
-        """Expand sidebar."""
-        if self.collapsed:
-            self.toggle()
-
-    def collapse_sidebar(self) -> None:
-        """Collapse sidebar."""
-        if not self.collapsed:
-            self.toggle()
-
-
-class TabularLayout(Container):
-    """Optimized layout for data tables with optional sidebar."""
-
-    DEFAULT_CSS = """
-    TabularLayout {
-        layout: horizontal;
-        height: 100%;
-    }
-
-    TabularLayout .main-content {
-        width: 1fr;
-        height: 100%;
-        layout: vertical;
-    }
-
-    TabularLayout .table-container {
-        height: 1fr;
-        overflow: auto;
-        border: solid $border;
-        background: $surface;
-    }
-
-    TabularLayout .table-header {
-        dock: top;
-        height: 3;
-        background: $primary;
-        color: $text;
-        padding: 1;
-    }
-
-    TabularLayout .table-footer {
-        dock: bottom;
-        height: 3;
-        background: $surface-lighten-1;
-        padding: 1;
-        border-top: solid $border;
-    }
-    """
-
-    def __init__(
-        self,
-        table_widget: Any,
-        header_content: Any | None = None,
-        footer_content: Any | None = None,
-        sidebar_content: Any | None = None,
-        **kwargs: Any,
-    ) -> None:
-        """Initialize tabular layout."""
-        super().__init__(**kwargs)
-        self.table_widget = table_widget
-        self.header_content = header_content
-        self.footer_content = footer_content
-        self.sidebar_content = sidebar_content
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose layout with optional sidebar."""
-        if self.sidebar_content:
-            yield CollapsibleSidebar(self.sidebar_content)
-
-        with Container(classes="main-content"):
-            if self.header_content:
-                yield Container(self.header_content, classes="table-header")
-
-            yield Container(self.table_widget, classes="table-container")
-
-            if self.footer_content:
-                yield Container(self.footer_content, classes="table-footer")
-
-
-class CardLayout(ResponsiveGrid):
-    """Grid layout optimized for card-based content."""
-
-    DEFAULT_CSS = """
-    CardLayout {
-        grid-gutter: 2;
-        padding: 2;
-    }
-
-    CardLayout .card {
-        background: $surface;
-        border: solid $border;
-        border-radius: 1;
-        padding: 2;
-        height: auto;
-        min-height: 10;
-    }
-
-    CardLayout .card:hover {
-        border: solid $accent;
-        background: $surface-lighten-1;
-    }
-
-    CardLayout .card:focus {
-        border: solid $primary;
-    }
-
-    CardLayout .card-header {
-        dock: top;
-        height: 3;
-        background: $primary-lighten-1;
-        color: $text;
-        padding: 1;
-        margin: -2 -2 1 -2;
-        border-radius: 1 1 0 0;
-    }
-
-    CardLayout .card-content {
-        height: 1fr;
-        overflow: auto;
-    }
-
-    CardLayout .card-footer {
-        dock: bottom;
-        height: 3;
-        background: $surface-darken-1;
-        padding: 1;
-        margin: 1 -2 -2 -2;
-        border-radius: 0 0 1 1;
-    }
-    """
-
-    def __init__(self, **kwargs: Any) -> None:
-        """Initialize card layout with default settings for cards."""
-        # Default to auto-fit cards with minimum width
-        super().__init__(auto_fit=True, **kwargs)
-
-
-class SplitPane(Container):
-    """Resizable split pane layout."""
-
-    DEFAULT_CSS = """
-    SplitPane {
-        layout: horizontal;
-        height: 100%;
-    }
-
-    SplitPane.vertical {
-        layout: vertical;
-    }
-
-    SplitPane .left-pane,
-    SplitPane .top-pane {
-        width: 50%;
-        height: 50%;
-        background: $surface;
-        border-right: solid $border;
-        border-bottom: solid $border;
-    }
-
-    SplitPane .right-pane,
-    SplitPane .bottom-pane {
-        width: 50%;
-        height: 50%;
-        background: $surface;
-    }
-
-    SplitPane .splitter {
-        width: 1;
-        height: 1;
-        background: $border;
-    }
-
-    SplitPane.vertical .splitter {
-        width: 100%;
-        height: 1;
-    }
-    """
-
-    def __init__(
-        self,
-        left_content: Any,
-        right_content: Any,
-        vertical: bool = False,
-        split_ratio: float = 0.5,
-        **kwargs: Any,
-    ) -> None:
-        """Initialize split pane."""
-        super().__init__(**kwargs)
-        self.left_content = left_content
-        self.right_content = right_content
-        self.vertical = vertical
-        self.split_ratio = split_ratio
-
-    @override
-    def compose(self) -> ComposeResult:
-        """Compose split pane layout."""
-        if self.vertical:
-            _ = self.add_class("vertical")
-
-        pane_classes = ("top-pane", "bottom-pane") if self.vertical else ("left-pane", "right-pane")
-
-        yield Container(self.left_content, classes=pane_classes[0])
-        yield Static("", classes="splitter")
-        yield Container(self.right_content, classes=pane_classes[1])
-
-    def on_mount(self) -> None:
-        """Apply split ratio."""
-        if self.vertical:
-            self.query_one(f".{self.__class__.__name__} .top-pane").styles.height = f"{self.split_ratio * 100}%"
-            self.query_one(f".{self.__class__.__name__} .bottom-pane").styles.height = f"{(1 - self.split_ratio) * 100}%"
-        else:
-            self.query_one(f".{self.__class__.__name__} .left-pane").styles.width = f"{self.split_ratio * 100}%"
-            self.query_one(f".{self.__class__.__name__} .right-pane").styles.width = f"{(1 - self.split_ratio) * 100}%"
-</file>
-
 <file path="ingest_pipeline/cli/tui/models.py">
 """Data models and TypedDict definitions for the TUI."""
 
@@ -3720,847 +2144,6 @@ class R2RCollections:
         return results
 </file>
 
-<file path="ingest_pipeline/storage/r2r/storage.py">
-"""R2R storage implementation using the official R2R SDK."""
-
-from __future__ import annotations
-
-import asyncio
-import contextlib
-from collections.abc import AsyncGenerator, Iterable, Mapping, Sequence
-from datetime import UTC, datetime
-from typing import Self, TypeVar, cast
-from uuid import UUID, uuid4
-
-from r2r import R2RAsyncClient
-from typing_extensions import override
-
-# Direct imports for runtime and type checking
-# Note: Some type checkers (basedpyright/Pyrefly) may report import issues
-# but these work correctly at runtime and with mypy
-from httpx import AsyncClient, HTTPStatusError
-from r2r import R2RException
-
-from ...core.exceptions import StorageError
-from ...core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
-from ..base import BaseStorage
-
-T = TypeVar("T")
-
-
-def _as_mapping(value: object) -> dict[str, object]:
-    if isinstance(value, Mapping):
-        return dict(cast(Mapping[str, object], value))
-    if hasattr(value, "__dict__"):
-        return dict(cast(Mapping[str, object], value.__dict__))
-    return {}
-
-
-def _as_sequence(value: object) -> tuple[object, ...]:
-    """Convert value to a tuple of objects."""
-    if isinstance(value, Sequence):
-        return tuple(value)
-    return tuple(value) if isinstance(value, Iterable) else ()
-
-
-def _extract_id(source: object, fallback: str) -> str:
-    mapping = _as_mapping(source)
-    identifier = mapping.get("id") if mapping else None
-    if identifier is None and hasattr(source, "id"):
-        identifier = getattr(source, "id", None)
-    return fallback if identifier is None else str(identifier)
-
-
-def _as_datetime(value: object) -> datetime:
-    if isinstance(value, datetime):
-        return value
-    if isinstance(value, str):
-        with contextlib.suppress(ValueError):
-            return datetime.fromisoformat(value)
-    return datetime.now(UTC)
-
-
-def _as_int(value: object, default: int = 0) -> int:
-    if isinstance(value, bool):
-        return int(value)
-    if isinstance(value, int):
-        return value
-    if isinstance(value, float):
-        return int(value)
-    if isinstance(value, str):
-        try:
-            return int(float(value)) if "." in value else int(value)
-        except ValueError:
-            return default
-    return default
-
-
-class R2RStorage(BaseStorage):
-    """R2R storage implementation using the official R2R SDK."""
-
-    def __init__(self, config: StorageConfig) -> None:
-        """Initialize R2R storage with SDK client."""
-        super().__init__(config)
-        self.endpoint: str = str(config.endpoint).rstrip("/")
-        self.client: R2RAsyncClient = R2RAsyncClient(self.endpoint)
-        self.default_collection_id: str | None = None
-
-    @override
-    async def initialize(self) -> None:
-        """Initialize R2R connection and ensure default collection exists."""
-        try:
-            # Ensure we have an event loop
-            try:
-                _ = asyncio.get_running_loop()
-            except RuntimeError:
-                # No event loop running, this should not happen in async context
-                # but let's be defensive
-                import logging
-
-                logging.warning("No event loop found during R2R initialization")
-
-            # Test connection using direct HTTP call to v3 API
-            endpoint = self.endpoint
-            client = AsyncClient()
-            try:
-                response = await client.get(f"{endpoint}/v3/collections")
-                response.raise_for_status()
-            finally:
-                await client.aclose()
-            _ = await self._ensure_collection(self.config.collection_name)
-        except Exception as e:
-            raise StorageError(f"Failed to initialize R2R: {e}") from e
-
-    async def _ensure_collection(self, collection_name: str) -> str:
-        """Get or create collection by name."""
-        try:
-            endpoint = self.endpoint
-            client = AsyncClient()
-            try:
-                # List collections and find by name
-                response = await client.get(f"{endpoint}/v3/collections")
-                response.raise_for_status()
-                data: dict[str, object] = response.json()
-
-                results = cast(list[dict[str, object]], data.get("results", []))
-                for collection in results:
-                    if collection.get("name") == collection_name:
-                        collection_id = str(collection.get("id"))
-                        if collection_name == self.config.collection_name:
-                            self.default_collection_id = collection_id
-                        return collection_id
-
-                # Create if not found
-                create_response = await client.post(
-                    f"{endpoint}/v3/collections",
-                    json={
-                        "name": collection_name,
-                        "description": f"Auto-created collection: {collection_name}",
-                    },
-                )
-                create_response.raise_for_status()
-                created: dict[str, object] = create_response.json()
-                created_results = cast(dict[str, object], created.get("results", {}))
-                collection_id = str(created_results.get("id"))
-
-                if collection_name == self.config.collection_name:
-                    self.default_collection_id = collection_id
-
-                return collection_id
-            finally:
-                await client.aclose()
-
-        except Exception as e:
-            raise StorageError(f"Failed to ensure collection '{collection_name}': {e}") from e
-
-    @override
-    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
-        """Store a single document."""
-        return (await self.store_batch([document], collection_name=collection_name))[0]
-
-    @override
-    async def store_batch(
-        self, documents: list[Document], *, collection_name: str | None = None
-    ) -> list[str]:
-        """Store multiple documents."""
-        # Fix: Always ensure we have the correct collection ID
-        if collection_name:
-            # If a specific collection is requested, get its ID
-            collection_id = await self._ensure_collection(collection_name)
-        else:
-            # If no collection specified, use the default one from config
-            if self.default_collection_id:
-                collection_id = self.default_collection_id
-            else:
-                # Fallback: ensure the default collection exists
-                collection_id = await self._ensure_collection(self.config.collection_name)
-                self.default_collection_id = collection_id
-
-        print(
-            f"Using collection ID: {collection_id} for collection: {collection_name or self.config.collection_name}"
-        )
-
-        stored_ids: list[str] = []
-        failed_documents: list[Document] = []
-        for document in documents:
-            try:
-                # Create document with explicit ID using direct HTTP call
-                requested_id = str(document.id)
-                print(f"Creating document with ID: {requested_id}")
-
-                # Validate document before sending to R2R
-                if not document.content or not document.content.strip():
-                    print(f"Skipping document {requested_id}: empty content")
-                    failed_documents.append(document)
-                    continue
-
-                if len(document.content) > 1_000_000:  # 1MB limit
-                    print(
-                        f"Skipping document {requested_id}: content too large ({len(document.content)} chars)"
-                    )
-                    failed_documents.append(document)
-                    continue
-
-                # Use direct HTTP call with proper multipart form-data format
-                import asyncio
-                import json
-
-                max_retries = 3
-                retry_delay = 1.0
-                doc_response = None  # Initialize variable to avoid UnboundLocalError
-
-                for attempt in range(max_retries):
-                    try:
-                        async with AsyncClient() as http_client:
-                            # Use files parameter but with string values for multipart/form-data
-                            # This matches the cURL -F behavior more closely
-                            metadata = self._build_metadata(document)
-                            print(f"Built metadata for document {requested_id}: {metadata}")
-
-                            files = {
-                                "raw_text": (None, document.content),
-                                "metadata": (None, json.dumps(metadata)),
-                                "id": (None, requested_id),
-                                "ingestion_mode": (None, "hi-res"),  # Enable R2R enrichment
-                            }
-
-                            # Add collection_ids if we have a collection to assign to
-                            if collection_id:
-                                files["collection_ids"] = (None, json.dumps([collection_id]))
-                                print(
-                                    f"Creating document {requested_id} with collection_ids: [{collection_id}]"
-                                )
-
-                            print(f"Sending to R2R - files keys: {list(files.keys())}")
-                            print(f"Metadata JSON: {files['metadata'][1]}")
-
-                            response = await http_client.post(
-                                f"{self.endpoint}/v3/documents",
-                                files=files,
-                            )
-
-                            if response.status_code == 422:
-                                # Get detailed error information for 422 responses
-                                try:
-                                    error_detail = response.json()
-                                    print(
-                                        f"R2R validation error for document {requested_id}: {error_detail}"
-                                    )
-                                    print(f"Document content length: {len(document.content)}")
-                                    print(f"Document metadata sent: {metadata}")
-                                    print(f"Response status: {response.status_code}")
-                                    print(f"Response headers: {dict(response.headers)}")
-                                except Exception:
-                                    print(
-                                        f"R2R validation error for document {requested_id}: {response.text}"
-                                    )
-                                    print(f"Document metadata sent: {metadata}")
-                                # Don't retry validation errors
-                                break
-
-                            if response.status_code >= 500:
-                                # Server error - retry
-                                if attempt < max_retries - 1:
-                                    print(
-                                        f"Server error {response.status_code} for document {requested_id}, retrying in {retry_delay}s..."
-                                    )
-                                    await asyncio.sleep(retry_delay)
-                                    retry_delay *= 2  # Exponential backoff
-                                    continue
-
-                            response.raise_for_status()
-                            doc_response = response.json()
-                            break  # Success - exit retry loop
-
-                    except (OSError, asyncio.TimeoutError):
-                        if attempt < max_retries - 1:
-                            print(
-                                f"Timeout for document {requested_id}, retrying in {retry_delay}s..."
-                            )
-                            await asyncio.sleep(retry_delay)
-                            retry_delay *= 2
-                            continue
-                        else:
-                            raise
-                    except HTTPStatusError as e:
-                        if e.response.status_code >= 500 and attempt < max_retries - 1:
-                            print(
-                                f"Server error {e.response.status_code} for document {requested_id}, retrying in {retry_delay}s..."
-                            )
-                            await asyncio.sleep(retry_delay)
-                            retry_delay *= 2
-                            continue
-                        else:
-                            raise
-
-                # Only process response if we have a successful doc_response
-                if doc_response is not None:
-                    response_payload = doc_response.get("results", doc_response)
-                    doc_id = _extract_id(response_payload, requested_id)
-
-                    print(f"R2R returned document ID: {doc_id}")
-
-                    # Verify the ID matches what we requested
-                    if doc_id != requested_id:
-                        print(f"Warning: Requested ID {requested_id} but got {doc_id}")
-
-                    # Collection assignment is now handled during document creation
-                    # No need to add to collection afterward if collection_ids was provided
-                    if collection_id:
-                        print(
-                            f"Document {doc_id} should be assigned to collection {collection_id} via creation API"
-                        )
-
-                    stored_ids.append(doc_id)
-                else:
-                    print(f"No successful response received for document {requested_id}")
-                    failed_documents.append(document)
-
-            except Exception as exc:
-                print(f"Failed to store document {document.id}: {exc}")
-                failed_documents.append(document)
-
-                # Log specific error types for debugging
-                if "422" in str(exc):
-                    print("  → Data validation issue - check document content and metadata format")
-                elif "timeout" in str(exc).lower():
-                    print("  → Network timeout - R2R may be overloaded")
-                elif "500" in str(exc):
-                    print("  → Server error - R2R internal issue")
-                else:
-                    import traceback
-
-                    traceback.print_exc()
-                continue
-
-        return stored_ids
-
-    def _build_metadata(self, document: Document) -> dict[str, object]:
-        """Convert document metadata to enriched R2R format."""
-        metadata = document.metadata
-
-
-        # Core required fields
-        result: dict[str, object] = {
-            "source_url": metadata["source_url"],
-            "content_type": metadata["content_type"],
-            "word_count": metadata["word_count"],
-            "char_count": metadata["char_count"],
-            "timestamp": metadata["timestamp"].isoformat(),
-            "ingestion_source": document.source.value,
-        }
-
-        # Basic optional fields
-        if title := metadata.get("title"):
-            result["title"] = title
-        if description := metadata.get("description"):
-            result["description"] = description
-
-        # Content categorization
-        if tags := metadata.get("tags"):
-            result["tags"] = tags
-        if category := metadata.get("category"):
-            result["category"] = category
-        if section := metadata.get("section"):
-            result["section"] = section
-        if language := metadata.get("language"):
-            result["language"] = language
-
-        # Authorship and source info
-        if author := metadata.get("author"):
-            result["author"] = author
-        if domain := metadata.get("domain"):
-            result["domain"] = domain
-        if site_name := metadata.get("site_name"):
-            result["site_name"] = site_name
-
-        # Document structure
-        if heading_hierarchy := metadata.get("heading_hierarchy"):
-            result["heading_hierarchy"] = heading_hierarchy
-        if section_depth := metadata.get("section_depth"):
-            result["section_depth"] = section_depth
-        if has_code_blocks := metadata.get("has_code_blocks"):
-            result["has_code_blocks"] = has_code_blocks
-        if has_images := metadata.get("has_images"):
-            result["has_images"] = has_images
-        if has_links := metadata.get("has_links"):
-            result["has_links"] = has_links
-
-        # Processing metadata
-        if extraction_method := metadata.get("extraction_method"):
-            result["extraction_method"] = extraction_method
-        if crawl_depth := metadata.get("crawl_depth"):
-            result["crawl_depth"] = crawl_depth
-        if last_modified := metadata.get("last_modified"):
-            result["last_modified"] = last_modified.isoformat() if last_modified else None
-
-        # Content quality indicators
-        if readability_score := metadata.get("readability_score"):
-            result["readability_score"] = readability_score
-        if completeness_score := metadata.get("completeness_score"):
-            result["completeness_score"] = completeness_score
-
-        # Repository-specific fields
-        if file_path := metadata.get("file_path"):
-            result["file_path"] = file_path
-        if repository_name := metadata.get("repository_name"):
-            result["repository_name"] = repository_name
-        if branch_name := metadata.get("branch_name"):
-            result["branch_name"] = branch_name
-        if commit_hash := metadata.get("commit_hash"):
-            result["commit_hash"] = commit_hash
-        if programming_language := metadata.get("programming_language"):
-            result["programming_language"] = programming_language
-
-        # Custom business metadata
-        if importance_score := metadata.get("importance_score"):
-            result["importance_score"] = importance_score
-        if review_status := metadata.get("review_status"):
-            result["review_status"] = review_status
-        if assigned_team := metadata.get("assigned_team"):
-            result["assigned_team"] = assigned_team
-
-        return result
-
-    @override
-    async def retrieve(
-        self, document_id: str, *, collection_name: str | None = None
-    ) -> Document | None:
-        """Retrieve a document by ID."""
-        try:
-            response = await self.client.documents.retrieve(document_id)
-        except R2RException as exc:
-            status_code = getattr(exc, "status_code", None)
-            if status_code == 404:
-                return None
-            import logging
-
-            logging.warning(f"Unexpected error retrieving document {document_id}: {exc}")
-            return None
-        except Exception as error:
-            import logging
-
-            logging.warning(f"Unexpected error retrieving document {document_id}: {error}")
-            return None
-        payload = getattr(response, "results", response)
-        return self._convert_to_document(payload, collection_name)
-
-    def _convert_to_document(self, r2r_doc: object, collection_name: str | None = None) -> Document:
-        """Convert R2R document payload to our Document model."""
-        doc_map = _as_mapping(r2r_doc)
-        metadata_map = _as_mapping(doc_map.get("metadata", {}))
-
-
-        doc_id_str = _extract_id(r2r_doc, str(uuid4()))
-        try:
-            doc_uuid = UUID(doc_id_str)
-        except ValueError:
-            doc_uuid = uuid4()
-
-        timestamp = _as_datetime(doc_map.get("created_at", metadata_map.get("timestamp")))
-
-        metadata: DocumentMetadata = {
-            # Core required fields
-            "source_url": str(metadata_map.get("source_url", "")),
-            "timestamp": timestamp,
-            "content_type": str(metadata_map.get("content_type", "text/plain")),
-            "word_count": _as_int(metadata_map.get("word_count")),
-            "char_count": _as_int(metadata_map.get("char_count")),
-        }
-
-        # Add optional fields if present
-        # Check for title in both top-level and metadata (R2R schema has title as top-level field)
-        if title := (doc_map.get("title") or metadata_map.get("title")):
-            metadata["title"] = cast(str | None, title)
-        # Check for summary in top-level R2R field (R2R schema has summary as top-level field)
-        if summary := (doc_map.get("summary") or metadata_map.get("summary")):
-            metadata["description"] = cast(str | None, summary)
-        elif description := metadata_map.get("description"):
-            metadata["description"] = cast(str | None, description)
-        if tags := metadata_map.get("tags"):
-            metadata["tags"] = [str(tag) for tag in tags] if isinstance(tags, list) else []
-        if category := metadata_map.get("category"):
-            metadata["category"] = str(category)
-        if section := metadata_map.get("section"):
-            metadata["section"] = str(section)
-        if language := metadata_map.get("language"):
-            metadata["language"] = str(language)
-        if author := metadata_map.get("author"):
-            metadata["author"] = str(author)
-        if domain := metadata_map.get("domain"):
-            metadata["domain"] = str(domain)
-        if site_name := metadata_map.get("site_name"):
-            metadata["site_name"] = str(site_name)
-        if heading_hierarchy := metadata_map.get("heading_hierarchy"):
-            metadata["heading_hierarchy"] = (
-                list(heading_hierarchy) if isinstance(heading_hierarchy, list) else []
-            )
-        if section_depth := metadata_map.get("section_depth"):
-            metadata["section_depth"] = _as_int(section_depth)
-        if has_code_blocks := metadata_map.get("has_code_blocks"):
-            metadata["has_code_blocks"] = bool(has_code_blocks)
-        if has_images := metadata_map.get("has_images"):
-            metadata["has_images"] = bool(has_images)
-        if has_links := metadata_map.get("has_links"):
-            metadata["has_links"] = bool(has_links)
-        if extraction_method := metadata_map.get("extraction_method"):
-            metadata["extraction_method"] = str(extraction_method)
-        if crawl_depth := metadata_map.get("crawl_depth"):
-            metadata["crawl_depth"] = _as_int(crawl_depth)
-        if last_modified := metadata_map.get("last_modified"):
-            metadata["last_modified"] = _as_datetime(last_modified)
-        if readability_score := metadata_map.get("readability_score"):
-            try:
-                metadata["readability_score"] = float(str(readability_score))
-            except (ValueError, TypeError):
-                metadata["readability_score"] = None
-        if completeness_score := metadata_map.get("completeness_score"):
-            try:
-                metadata["completeness_score"] = float(str(completeness_score))
-            except (ValueError, TypeError):
-                metadata["completeness_score"] = None
-
-        source_value = str(metadata_map.get("ingestion_source", IngestionSource.WEB.value))
-        try:
-            source_enum = IngestionSource(source_value)
-        except ValueError:
-            source_enum = IngestionSource.WEB
-
-        content_value = doc_map.get("content", getattr(r2r_doc, "content", ""))
-
-        return Document(
-            id=doc_uuid,
-            content=str(content_value),
-            metadata=metadata,
-            source=source_enum,
-            collection=collection_name or self.config.collection_name,
-        )
-
-    @override
-    async def search(
-        self,
-        query: str,
-        limit: int = 10,
-        threshold: float = 0.7,
-        *,
-        collection_name: str | None = None,
-    ) -> AsyncGenerator[Document, None]:
-        """Search documents using R2R."""
-        try:
-            search_settings: dict[str, object] = {
-                "limit": limit,
-                "similarity_threshold": threshold,
-            }
-
-            if collection_name:
-                collection_id = await self._ensure_collection(collection_name)
-                search_settings["collection_ids"] = [collection_id]
-
-            search_response = await self.client.retrieval.search(
-                query=query,
-                search_settings=search_settings,
-            )
-
-            for result in _as_sequence(getattr(search_response, "results", ())):
-                result_map = _as_mapping(result)
-                document_id_value = result_map.get(
-                    "document_id", getattr(result, "document_id", None)
-                )
-                if document_id_value is None:
-                    continue
-                document_id = str(document_id_value)
-
-                try:
-                    doc_response = await self.client.documents.retrieve(document_id)
-                except R2RException as exc:
-                    import logging
-
-                    logging.warning(
-                        f"Failed to retrieve document {document_id} during search: {exc}"
-                    )
-                    continue
-
-                document_payload = getattr(doc_response, "results", doc_response)
-                document = self._convert_to_document(document_payload, collection_name)
-
-                score_value = result_map.get("score", getattr(result, "score", None))
-                if score_value is not None:
-                    try:
-                        # Handle various score value types safely
-                        if isinstance(score_value, (int, float, str)):
-                            document.score = float(score_value)
-                        else:
-                            # For unknown types, try string conversion first
-                            document.score = float(str(score_value))
-                    except (TypeError, ValueError) as e:
-                        import logging
-
-                        logging.debug(
-                            f"Invalid score value {score_value} for document {document_id}: {e}"
-                        )
-                        document.score = None
-
-                yield document
-
-        except R2RException as exc:
-            raise StorageError(f"Search failed: {exc}") from exc
-
-    @override
-    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
-        """Delete a document."""
-        try:
-            _ = await self.client.documents.delete(document_id)
-            return True
-        except R2RException:
-            return False
-
-    @override
-    async def count(self, *, collection_name: str | None = None) -> int:
-        """Get document count in collection."""
-        try:
-            endpoint = self.endpoint
-            client = AsyncClient()
-            try:
-                # Get collections and find the count for the specific collection
-                response = await client.get(f"{endpoint}/v3/collections")
-                response.raise_for_status()
-                data: dict[str, object] = response.json()
-
-                target_collection = collection_name or self.config.collection_name
-                results = cast(list[dict[str, object]], data.get("results", []))
-                for collection in results:
-                    if collection.get("name") == target_collection:
-                        doc_count = collection.get("document_count", 0)
-                        return _as_int(doc_count)
-
-                return 0
-            finally:
-                await client.aclose()
-        except Exception:
-            return 0
-
-    @override
-    async def close(self) -> None:
-        """Close R2R client."""
-        try:
-            await self.client.close()
-        except Exception as e:
-            import logging
-
-            logging.warning(f"Error closing R2R client: {e}")
-
-    async def __aenter__(self) -> Self:
-        """Async context manager entry."""
-        return self
-
-    async def __aexit__(
-        self,
-        exc_type: type[BaseException] | None,
-        exc_val: BaseException | None,
-        exc_tb: object | None,
-    ) -> None:
-        """Async context manager exit with proper cleanup."""
-        await self.close()
-
-    # Additional R2R-specific comprehensive management methods
-
-    async def create_collection(self, name: str, description: str | None = None) -> str:
-        """Create a new collection."""
-        try:
-            response = await self.client.collections.create(name=name, description=description)
-            created = _as_mapping(getattr(response, "results", {}))
-            return str(created.get("id", name))
-        except R2RException as exc:
-            raise StorageError(f"Failed to create collection {name}: {exc}") from exc
-
-    async def delete_collection(self, collection_name: str) -> bool:
-        """Delete a collection."""
-        try:
-            collection_id = await self._ensure_collection(collection_name)
-            _ = await self.client.collections.delete(collection_id)
-            return True
-        except R2RException:
-            return False
-
-    @override
-    async def list_collections(self) -> list[str]:
-        """List all available collections."""
-        try:
-            endpoint = self.endpoint
-            client = AsyncClient()
-            try:
-                response = await client.get(f"{endpoint}/v3/collections")
-                response.raise_for_status()
-                data: dict[str, object] = response.json()
-
-                collection_names: list[str] = []
-                results = cast(list[dict[str, object]], data.get("results", []))
-                for entry in results:
-                    if name := entry.get("name"):
-                        collection_names.append(str(name))
-                return collection_names
-            finally:
-                await client.aclose()
-        except Exception as e:
-            raise StorageError(f"Failed to list collections: {e}") from e
-
-    async def list_collections_detailed(self) -> list[dict[str, object]]:
-        """List all available collections with detailed information."""
-        try:
-            response = await self.client.collections.list()
-            collections: list[dict[str, object]] = []
-            for entry in _as_sequence(getattr(response, "results", ())):
-                entry_map = _as_mapping(entry)
-                collections.append(
-                    {
-                        "id": str(entry_map.get("id", "")),
-                        "name": str(entry_map.get("name", "")),
-                        "description": entry_map.get("description"),
-                    }
-                )
-            return collections
-        except R2RException as exc:
-            raise StorageError(f"Failed to list collections: {exc}") from exc
-
-    async def get_document_chunks(self, document_id: str) -> list[dict[str, object]]:
-        """Get all chunks for a specific document."""
-        try:
-            response = await self.client.chunks.list(filters={"document_id": document_id})
-            return [
-                dict(_as_mapping(chunk)) for chunk in _as_sequence(getattr(response, "results", ()))
-            ]
-        except R2RException as exc:
-            raise StorageError(f"Failed to get chunks for document {document_id}: {exc}") from exc
-
-    async def extract_entities(self, document_id: str) -> dict[str, object]:
-        """Extract entities and relationships from a document."""
-        try:
-            response = await self.client.documents.extract(id=document_id)
-            return dict(_as_mapping(getattr(response, "results", {})))
-        except R2RException as exc:
-            raise StorageError(
-                f"Failed to extract entities from document {document_id}: {exc}"
-            ) from exc
-
-    async def get_document_overview(self, document_id: str) -> dict[str, object]:
-        """Get comprehensive document overview and statistics."""
-        try:
-            doc_response = await self.client.documents.retrieve(document_id)
-            chunks_response = await self.client.chunks.list(filters={"document_id": document_id})
-            document_payload = dict(_as_mapping(getattr(doc_response, "results", {})))
-            chunk_payload = [
-                dict(_as_mapping(chunk))
-                for chunk in _as_sequence(getattr(chunks_response, "results", ()))
-            ]
-            return {
-                "document": document_payload,
-                "chunk_count": len(chunk_payload),
-                "chunks": chunk_payload,
-            }
-        except R2RException as exc:
-            raise StorageError(f"Failed to get overview for document {document_id}: {exc}") from exc
-
-    @override
-    async def list_documents(
-        self,
-        limit: int = 100,
-        offset: int = 0,
-        *,
-        collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
-        """
-        List documents in R2R with pagination.
-
-        Args:
-            limit: Maximum number of documents to return
-            offset: Number of documents to skip
-            collection_name: Collection name (optional)
-
-        Returns:
-            List of document dictionaries with metadata
-        """
-        try:
-            documents: list[dict[str, object]] = []
-
-            if collection_name:
-                # Get collection ID first
-                collection_id = await self._ensure_collection(collection_name)
-                # Use the collections API to list documents in a specific collection
-                endpoint = self.endpoint
-                client = AsyncClient()
-                try:
-                    params = {"offset": offset, "limit": limit}
-                    response = await client.get(
-                        f"{endpoint}/v3/collections/{collection_id}/documents", params=params
-                    )
-                    response.raise_for_status()
-                    data: dict[str, object] = response.json()
-                finally:
-                    await client.aclose()
-
-                doc_sequence = _as_sequence(data.get("results", []))
-            else:
-                # List all documents
-                r2r_response = await self.client.documents.list(offset=offset, limit=limit)
-                documents_data: list[object] | dict[str, object] = getattr(
-                    r2r_response, "results", []
-                )
-
-                doc_sequence = _as_sequence(
-                    documents_data.get("results", [])
-                    if isinstance(documents_data, dict)
-                    else documents_data
-                )
-
-            for doc_data in doc_sequence:
-                doc_map = _as_mapping(doc_data)
-
-                # Extract standard document fields
-                doc_id = str(doc_map.get("id", ""))
-                title = str(doc_map.get("title", "Untitled"))
-                metadata = _as_mapping(doc_map.get("metadata", {}))
-
-                documents.append(
-                    {
-                        "id": doc_id,
-                        "title": title,
-                        "source_url": str(metadata.get("source_url", "")),
-                        "description": str(metadata.get("description", "")),
-                        "content_type": str(metadata.get("content_type", "text/plain")),
-                        "content_preview": str(doc_map.get("content", ""))[:200] + "..."
-                        if doc_map.get("content")
-                        else "",
-                        "word_count": _as_int(metadata.get("word_count", 0)),
-                        "timestamp": str(doc_map.get("created_at", "")),
-                    }
-                )
-
-            return documents
-
-        except Exception as e:
-            raise StorageError(f"Failed to list documents: {e}") from e
-</file>
-
 <file path="ingest_pipeline/storage/__init__.py">
 """Storage adapters for different backends."""
 
@@ -4588,1017 +2171,6 @@ __all__ = [
 ]
 </file>
 
-<file path="ingest_pipeline/cli/tui/screens/dashboard.py">
-"""Main dashboard screen with collections overview."""
-
-import logging
-from datetime import datetime
-from typing import TYPE_CHECKING, Final
-
-from textual import work
-from textual.app import ComposeResult
-from textual.binding import Binding
-from textual.containers import Container, Grid, Horizontal
-from textual.css.query import NoMatches
-from textual.reactive import reactive, var
-from textual.screen import Screen
-from textual.widgets import (
-    Button,
-    Footer,
-    Header,
-    LoadingIndicator,
-    Rule,
-    Static,
-    TabbedContent,
-    TabPane,
-)
-from typing_extensions import override
-
-from ....core.models import StorageBackend
-from ....storage.base import BaseStorage
-from ....storage.openwebui import OpenWebUIStorage
-from ....storage.weaviate import WeaviateStorage
-from ..models import CollectionInfo
-from ..utils.storage_manager import StorageManager
-from ..widgets import EnhancedDataTable, MetricsCard, StatusIndicator
-
-if TYPE_CHECKING:
-    from ....storage.r2r.storage import R2RStorage
-else:  # pragma: no cover - optional dependency fallback
-    R2RStorage = BaseStorage
-
-
-LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
-
-
-class CollectionOverviewScreen(Screen[None]):
-    """Enhanced dashboard with modern design and metrics."""
-
-    total_documents: int = 0
-    total_collections: int = 0
-    active_backends: int = 0
-
-    BINDINGS = [
-        Binding("q", "quit", "Quit"),
-        Binding("r", "refresh", "Refresh"),
-        Binding("i", "ingest", "Ingest"),
-        Binding("m", "manage", "Manage"),
-        Binding("s", "search", "Search"),
-        Binding("ctrl+d", "delete", "Delete"),
-        Binding("ctrl+1", "tab_dashboard", "Dashboard"),
-        Binding("ctrl+2", "tab_collections", "Collections"),
-        Binding("ctrl+3", "tab_analytics", "Analytics"),
-        Binding("tab", "next_tab", "Next Tab"),
-        Binding("shift+tab", "prev_tab", "Prev Tab"),
-        Binding("f1", "help", "Help"),
-    ]
-
-    collections: var[list[CollectionInfo]] = var([])
-    is_loading: var[bool] = var(False)
-    selected_collection: reactive[CollectionInfo | None] = reactive(None)
-    storage_manager: StorageManager
-    weaviate: WeaviateStorage | None
-    openwebui: OpenWebUIStorage | None
-    r2r: R2RStorage | BaseStorage | None
-
-    def __init__(
-        self,
-        storage_manager: StorageManager,
-        weaviate: WeaviateStorage | None,
-        openwebui: OpenWebUIStorage | None,
-        r2r: R2RStorage | BaseStorage | None,
-    ) -> None:
-        super().__init__()
-        self.storage_manager = storage_manager
-        self.weaviate = weaviate
-        self.openwebui = openwebui
-        self.r2r = r2r
-        self.total_documents = 0
-        self.total_collections = 0
-        self.active_backends = 0
-
-    @override
-    def compose(self) -> ComposeResult:
-        yield Header(show_clock=True)
-
-        with TabbedContent():
-            # Dashboard Tab
-            with TabPane("Dashboard", id="dashboard"):
-                yield Container(
-                    Static("🚀 Collection Management System", classes="title"),
-                    Static("Modern document ingestion and management platform", classes="subtitle"),
-                    Rule(line_style="heavy"),
-                    # Metrics Grid
-                    Container(
-                        Grid(
-                            MetricsCard(
-                                "Collections", str(self.total_collections), "Active collections"
-                            ),
-                            MetricsCard("Documents", str(self.total_documents), "Total indexed"),
-                            MetricsCard(
-                                "Backends", str(self.active_backends), "Connected services"
-                            ),
-                            MetricsCard("Status", "Online", "System health"),
-                            classes="responsive-grid metrics-grid",
-                        ),
-                        classes="center",
-                    ),
-                    Rule(line_style="dashed"),
-                    # Quick Actions
-                    Container(
-                        Static("⚡ Quick Actions", classes="section-title"),
-                        Horizontal(
-                            Button("🔄 Refresh Data", id="quick_refresh", variant="primary"),
-                            Button("📥 New Ingestion", id="quick_ingest", variant="success"),
-                            Button("🔍 Search All", id="quick_search", variant="default"),
-                            Button("⚙️ Settings", id="quick_settings", variant="default"),
-                            classes="action_buttons",
-                        ),
-                        classes="card",
-                    ),
-                    # Recent Activity
-                    Container(
-                        Static("📊 Recent Activity", classes="section-title"),
-                        Static(
-                            "Loading recent activity...", id="activity_feed", classes="status-text"
-                        ),
-                        classes="card",
-                    ),
-                    classes="main_container",
-                )
-
-            # Collections Tab
-            with TabPane("Collections", id="collections"):
-                yield Container(
-                    Static("📚 Collection Overview", classes="title"),
-                    # Collection controls
-                    Horizontal(
-                        Button("🔄 Refresh", id="refresh_btn", variant="primary"),
-                        Button("📥 Ingest", id="ingest_btn", variant="success"),
-                        Button("🔧 Manage", id="manage_btn", variant="warning"),
-                        Button("🗑️ Delete", id="delete_btn", variant="error"),
-                        Button("🔍 Search", id="search_btn", variant="default"),
-                        classes="button_bar",
-                    ),
-                    # Collection table with enhanced navigation
-                    EnhancedDataTable(id="collections_table", classes="enhanced-table"),
-                    # Status bar
-                    Container(
-                        Static("Ready", id="status_text", classes="status-text"),
-                        StatusIndicator("Ready", id="connection_status"),
-                        classes="status-bar",
-                    ),
-                    LoadingIndicator(id="loading", classes="pulse"),
-                    classes="main_container",
-                )
-
-            # Analytics Tab
-            with TabPane("Analytics", id="analytics"):
-                yield Container(
-                    Static("📈 Analytics & Insights", classes="title"),
-                    # Analytics content
-                    Container(
-                        Static("🚧 Analytics Dashboard", classes="section-title"),
-                        Static("Advanced analytics and insights coming soon!", classes="subtitle"),
-                        # Placeholder charts area
-                        Container(
-                            Static("📊 Document Distribution", classes="chart-title"),
-                            Static(
-                                "Chart placeholder - integrate with visualization library",
-                                classes="chart-placeholder",
-                            ),
-                            classes="card",
-                        ),
-                        Container(
-                            Static("⏱️ Ingestion Timeline", classes="chart-title"),
-                            Static("Timeline chart placeholder", classes="chart-placeholder"),
-                            classes="card",
-                        ),
-                        classes="analytics-grid",
-                    ),
-                    classes="main_container",
-                )
-
-        yield Footer()
-
-    async def on_mount(self) -> None:
-        """Initialize the screen with enhanced loading."""
-        self.query_one("#loading").display = False
-        self.update_metrics()
-        self.refresh_collections()  # Don't await, let it run as a worker
-
-    def update_metrics(self) -> None:
-        """Update dashboard metrics with enhanced calculations."""
-        self._calculate_metrics()
-        self._update_metrics_cards()
-        self._update_activity_feed()
-
-    def _calculate_metrics(self) -> None:
-        """Calculate basic metrics from collections."""
-        self.total_collections = len(self.collections)
-        self.total_documents = sum(col["count"] for col in self.collections)
-        self.active_backends = sum([bool(self.weaviate), bool(self.openwebui), bool(self.r2r)])
-
-    def _update_metrics_cards(self) -> None:
-        """Update the metrics cards display."""
-        try:
-            dashboard_tab = self.query_one("#dashboard")
-            metrics_cards_query = dashboard_tab.query(MetricsCard)
-            if len(metrics_cards_query) >= 4:
-                metrics_cards = list(metrics_cards_query)
-                self._update_card_values(metrics_cards)
-                self._update_status_card(metrics_cards[3])
-        except NoMatches:
-            return
-        except Exception as exc:
-            LOGGER.exception("Failed to update dashboard metrics", exc_info=exc)
-
-    def _update_card_values(self, metrics_cards: list[MetricsCard]) -> None:
-        """Update individual metric card values."""
-        metrics_cards[0].query_one(".metrics-value", Static).update(f"{self.total_collections:,}")
-        metrics_cards[1].query_one(".metrics-value", Static).update(f"{self.total_documents:,}")
-        metrics_cards[2].query_one(".metrics-value", Static).update(str(self.active_backends))
-
-    def _update_status_card(self, status_card: MetricsCard) -> None:
-        """Update the system status card."""
-        if self.active_backends > 0 and self.total_collections > 0:
-            status_text, status_class = "🟢 Healthy", "status-active"
-        elif self.active_backends > 0:
-            status_text, status_class = "🟡 Ready", "status-warning"
-        else:
-            status_text, status_class = "🔴 Offline", "status-error"
-
-        status_card.query_one(".metrics-value", Static).update(status_text)
-        status_card.add_class(status_class)
-
-    def _update_activity_feed(self) -> None:
-        """Update the activity feed with collection data."""
-        try:
-            dashboard_tab = self.query_one("#dashboard")
-            activity_feed = dashboard_tab.query_one("#activity_feed", Static)
-            activity_text = self._generate_activity_text()
-            activity_feed.update(activity_text)
-        except NoMatches:
-            return
-        except Exception as exc:
-            LOGGER.exception("Failed to update dashboard activity feed", exc_info=exc)
-
-    def _generate_activity_text(self) -> str:
-        """Generate activity feed text from collections."""
-        if not self.collections:
-            return "🚀 No collections found. Start by creating your first ingestion!\n💡 Press 'I' to begin or use the Quick Actions above."
-
-        recent_activity = [self._format_collection_item(col) for col in self.collections[:3]]
-        activity_text = "\n".join(recent_activity)
-
-        if len(self.collections) > 3:
-            total_docs = sum(c["count"] for c in self.collections)
-            activity_text += (
-                f"\n📊 Total: {len(self.collections)} collections with {total_docs:,} documents"
-            )
-
-        return activity_text
-
-    def _format_collection_item(self, col: CollectionInfo) -> str:
-        """Format a single collection item for the activity feed."""
-        content_type = self._get_content_type_icon(col["name"])
-        size_mb = col["size_mb"]
-        backend_info = col["backend"]
-
-        # Check if this represents a multi-backend ingestion result
-        if isinstance(backend_info, list):
-            if len(backend_info) > 1:
-                # Ensure all elements are strings for safe joining
-                backend_strings = [str(b) for b in backend_info if b is not None]
-                backend_list = " + ".join(backend_strings) if backend_strings else "unknown"
-                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) → {backend_list}"
-            elif len(backend_info) == 1:
-                backend_name = str(backend_info[0]) if backend_info[0] is not None else "unknown"
-                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - {backend_name}"
-            else:
-                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - unknown"
-        else:
-            backend_display = str(backend_info) if backend_info is not None else "unknown"
-            return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - {backend_display}"
-
-    def _get_content_type_icon(self, name: str) -> str:
-        """Get appropriate icon for collection content type."""
-        name_lower = name.lower()
-        if "web" in name_lower:
-            return "🌐"
-        elif "doc" in name_lower:
-            return "📖"
-        elif "repo" in name_lower:
-            return "📦"
-        return "📄"
-
-    @work(exclusive=True)
-    async def refresh_collections(self) -> None:
-        """Refresh collection data with enhanced multi-backend loading feedback."""
-        self.is_loading = True
-        loading_indicator = self.query_one("#loading")
-        status_text = self.query_one("#status_text", Static)
-
-        loading_indicator.display = True
-        status_text.update("🔄 Refreshing collections...")
-
-        try:
-            # Use storage manager for unified backend handling
-            if not self.storage_manager.is_initialized:
-                status_text.update("🔗 Initializing storage backends...")
-                backend_results = await self.storage_manager.initialize_all_backends()
-
-                # Report per-backend initialization status
-                success_count = sum(backend_results.values())
-                total_count = len(backend_results)
-                status_text.update(f"✅ Initialized {success_count}/{total_count} backends")
-
-            # Get collections from all backends via storage manager
-            status_text.update("📚 Loading collections from all backends...")
-            collections = await self.storage_manager.get_all_collections()
-
-            # Update metrics calculation for multi-backend support
-            self.active_backends = len(self.storage_manager.get_available_backends())
-
-            self.collections = collections
-            await self.update_collections_table()
-            self.update_metrics()
-
-            # Enhanced status reporting for multi-backend
-            backend_names = ", ".join(
-                backend.value for backend in self.storage_manager.get_available_backends()
-            )
-            status_text.update(f"✨ Ready - {len(collections)} collections from {backend_names}")
-
-            # Update connection status with multi-backend awareness
-            connection_status = self.query_one("#connection_status", StatusIndicator)
-            if collections and self.active_backends > 0:
-                connection_status.update_status(f"✓ {self.active_backends} Active")
-            else:
-                connection_status.update_status("No Data")
-
-        except Exception as e:
-            status_text.update(f"❌ Error: {e}")
-            self.notify(f"Failed to refresh: {e}", severity="error", markup=False)
-        finally:
-            self.is_loading = False
-            loading_indicator.display = False
-
-    async def list_weaviate_collections(self) -> list[CollectionInfo]:
-        """List Weaviate collections with enhanced metadata."""
-        if not self.weaviate:
-            return []
-
-        try:
-            overview = await self.weaviate.describe_collections()
-            collections: list[CollectionInfo] = []
-
-            for item in overview:
-                count_raw = item.get("count", 0)
-                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
-                size_mb_raw = item.get("size_mb", 0.0)
-                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
-                collections.append(
-                    CollectionInfo(
-                        name=str(item.get("name", "Unknown")),
-                        type="weaviate",
-                        count=count_val,
-                        backend="🗄️ Weaviate",
-                        status="✓ Active",
-                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
-                        size_mb=size_mb_val,
-                    )
-                )
-
-            return collections
-        except Exception as e:
-            self.notify(f"Error listing Weaviate collections: {e}", severity="error", markup=False)
-            return []
-
-    async def list_openwebui_collections(self) -> list[CollectionInfo]:
-        """List OpenWebUI collections with enhanced metadata."""
-        # Try to get OpenWebUI backend from storage manager if direct instance not available
-        openwebui_backend = self.openwebui or self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
-        if not openwebui_backend:
-            return []
-
-        try:
-            overview = await openwebui_backend.describe_collections()
-            collections: list[CollectionInfo] = []
-
-            for item in overview:
-                count_raw = item.get("count", 0)
-                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
-                size_mb_raw = item.get("size_mb", 0.0)
-                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
-                collection_name = str(item.get("name", "Unknown"))
-                collections.append(
-                    CollectionInfo(
-                        name=collection_name,
-                        type="openwebui",
-                        count=count_val,
-                        backend="🌐 OpenWebUI",
-                        status="✓ Active",
-                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
-                        size_mb=size_mb_val,
-                    )
-                )
-
-            return collections
-        except Exception as e:
-            self.notify(f"Error listing OpenWebUI collections: {e}", severity="error", markup=False)
-            return []
-
-    async def update_collections_table(self) -> None:
-        """Update the collections table with enhanced formatting."""
-        table = self.query_one("#collections_table", EnhancedDataTable)
-        table.clear(columns=True)
-
-        # Add enhanced columns with more metadata
-        table.add_columns("Collection", "Backend", "Documents", "Size", "Type", "Status", "Updated")
-
-        # Add rows with enhanced formatting
-        for collection in self.collections:
-            # Format size
-            size_str = f"{collection['size_mb']:.1f} MB"
-            if collection["size_mb"] > 1000:
-                size_str = f"{collection['size_mb'] / 1000:.1f} GB"
-
-            # Format document count
-            doc_count = f"{collection['count']:,}"
-
-            # Determine content type based on collection name or other metadata
-            content_type = "📄 Mixed"
-            if "web" in collection["name"].lower():
-                content_type = "🌐 Web"
-            elif "doc" in collection["name"].lower():
-                content_type = "📖 Docs"
-            elif "repo" in collection["name"].lower():
-                content_type = "📦 Code"
-
-            table.add_row(
-                collection["name"],
-                collection["backend"],
-                doc_count,
-                size_str,
-                content_type,
-                collection["status"],
-                collection["last_updated"],
-            )
-
-        if self.collections:
-            table.move_cursor(row=0)
-
-        self.get_selected_collection()
-
-    def update_search_controls(self, collection: CollectionInfo | None) -> None:
-        """Enable or disable search controls based on backend support."""
-        try:
-            search_button = self.query_one("#search_btn", Button)
-            quick_search_button = self.query_one("#quick_search", Button)
-        except Exception:
-            return
-
-        is_weaviate = bool(collection and collection.get("type") == "weaviate")
-        search_button.disabled = not is_weaviate
-        quick_search_button.disabled = not is_weaviate
-
-    def get_selected_collection(self) -> CollectionInfo | None:
-        """Get the currently selected collection."""
-        table = self.query_one("#collections_table", EnhancedDataTable)
-        try:
-            row_index = table.cursor_coordinate.row
-        except (AttributeError, IndexError):
-            self.selected_collection = None
-            self.update_search_controls(None)
-            return None
-
-        if 0 <= row_index < len(self.collections):
-            collection = self.collections[row_index]
-            self.selected_collection = collection
-            self.update_search_controls(collection)
-            return collection
-
-        self.selected_collection = None
-        self.update_search_controls(None)
-        return None
-
-    # Action methods
-    def action_refresh(self) -> None:
-        """Refresh collections."""
-        self.refresh_collections()
-
-    def action_ingest(self) -> None:
-        """Show enhanced ingestion dialog."""
-        if selected := self.get_selected_collection():
-            from .ingestion import IngestionScreen
-
-            self.app.push_screen(IngestionScreen(selected, self.storage_manager))
-        else:
-            self.notify("🔍 Please select a collection first", severity="warning")
-
-    def action_manage(self) -> None:
-        """Manage documents in selected collection."""
-        if selected := self.get_selected_collection():
-            if storage_backend := self._get_storage_for_collection(selected):
-                from .documents import DocumentManagementScreen
-
-                self.app.push_screen(DocumentManagementScreen(selected, storage_backend))
-            else:
-                self.notify(
-                    "🚧 No storage backend available for this collection", severity="warning"
-                )
-        else:
-            self.notify("🔍 Please select a collection first", severity="warning")
-
-    def _get_storage_for_collection(self, collection: CollectionInfo) -> BaseStorage | None:
-        """Get the appropriate storage backend for a collection."""
-        collection_type = collection.get("type", "")
-
-        # Map collection types to storage backends (try direct instances first)
-        if collection_type == "weaviate" and self.weaviate:
-            return self.weaviate
-        elif collection_type == "openwebui" and self.openwebui:
-            return self.openwebui
-        elif collection_type == "r2r" and self.r2r:
-            return self.r2r
-
-        # Fall back to storage manager if direct instances not available
-        if collection_type == "weaviate":
-            return self.storage_manager.get_backend(StorageBackend.WEAVIATE)
-        elif collection_type == "openwebui":
-            return self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
-        elif collection_type == "r2r":
-            return self.storage_manager.get_backend(StorageBackend.R2R)
-
-        # Fall back to checking available backends by backend name
-        backend_name = collection.get("backend", "")
-        if isinstance(backend_name, str):
-            if "weaviate" in backend_name.lower():
-                return self.weaviate or self.storage_manager.get_backend(StorageBackend.WEAVIATE)
-            elif "openwebui" in backend_name.lower():
-                return self.openwebui or self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
-            elif "r2r" in backend_name.lower():
-                return self.r2r or self.storage_manager.get_backend(StorageBackend.R2R)
-
-        return None
-
-    def action_search(self) -> None:
-        """Search in selected collection."""
-        if selected := self.get_selected_collection():
-            if selected["type"] != "weaviate":
-                self.notify(
-                    "🔐 Search is currently available only for Weaviate collections",
-                    severity="warning",
-                )
-                return
-            from .search import SearchScreen
-
-            self.app.push_screen(SearchScreen(selected, self.weaviate, self.openwebui))
-        else:
-            self.notify("🔍 Please select a collection first", severity="warning")
-
-    def action_delete(self) -> None:
-        """Delete selected collection."""
-        if selected := self.get_selected_collection():
-            from .dialogs import ConfirmDeleteScreen
-
-            self.app.push_screen(ConfirmDeleteScreen(selected, self))
-        else:
-            self.notify("🔍 Please select a collection first", severity="warning")
-
-    def action_tab_dashboard(self) -> None:
-        """Switch to dashboard tab."""
-        tabs = self.query_one(TabbedContent)
-        tabs.active = "dashboard"
-
-    def action_tab_collections(self) -> None:
-        """Switch to collections tab."""
-        tabs = self.query_one(TabbedContent)
-        tabs.active = "collections"
-
-    def action_tab_analytics(self) -> None:
-        """Switch to analytics tab."""
-        tabs = self.query_one(TabbedContent)
-        tabs.active = "analytics"
-
-    def action_next_tab(self) -> None:
-        """Switch to next tab."""
-        tabs = self.query_one(TabbedContent)
-        tab_ids = ["dashboard", "collections", "analytics"]
-        current = tabs.active
-        try:
-            current_index = tab_ids.index(current)
-            next_index = (current_index + 1) % len(tab_ids)
-            tabs.active = tab_ids[next_index]
-        except (ValueError, AttributeError):
-            tabs.active = tab_ids[0]
-
-    def action_prev_tab(self) -> None:
-        """Switch to previous tab."""
-        tabs = self.query_one(TabbedContent)
-        tab_ids = ["dashboard", "collections", "analytics"]
-        current = tabs.active
-        try:
-            current_index = tab_ids.index(current)
-            prev_index = (current_index - 1) % len(tab_ids)
-            tabs.active = tab_ids[prev_index]
-        except (ValueError, AttributeError):
-            tabs.active = tab_ids[0]
-
-    def action_help(self) -> None:
-        """Show help screen."""
-        from .help import HelpScreen
-
-        help_md = """
-# 🚀 Modern Collection Management System
-
-## Navigation
-- **Tab** / **Shift+Tab**: Switch between tabs
-- **Ctrl+1/2/3**: Direct tab access
-- **Enter**: Activate selected item
-- **Escape**: Go back/cancel
-- **Arrow Keys**: Navigate within tables
-- **Home/End**: Jump to first/last row
-- **Page Up/Down**: Scroll by page
-
-## Collections
-- **R**: Refresh collections
-- **I**: Start ingestion
-- **M**: Manage documents
-- **S**: Search collection
-- **Ctrl+D**: Delete collection
-
-## Table Navigation
-- **Up/Down** or **J/K**: Navigate rows
-- **Space**: Toggle selection
-- **Ctrl+A**: Select all
-- **Ctrl+Shift+A**: Clear selection
-
-## General
-- **Q** / **Ctrl+C**: Quit application
-- **F1**: Show this help
-
-Enjoy the enhanced interface! 🎉
-        """
-        self.app.push_screen(HelpScreen(help_md))
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle button presses with enhanced feedback."""
-        button_id = event.button.id
-
-        # Add visual feedback
-        event.button.add_class("pressed")
-        self.call_later(self.remove_pressed_class, event.button)
-
-        if getattr(event.button, "disabled", False):
-            self.notify(
-                "🔐 Search is currently limited to Weaviate collections",
-                severity="warning",
-            )
-            return
-
-        if button_id in ["refresh_btn", "quick_refresh"]:
-            self.action_refresh()
-        elif button_id in ["ingest_btn", "quick_ingest"]:
-            self.action_ingest()
-        elif button_id == "manage_btn":
-            self.action_manage()
-        elif button_id == "delete_btn":
-            self.action_delete()
-        elif button_id in ["search_btn", "quick_search"]:
-            self.action_search()
-        elif button_id == "quick_settings":
-            self.notify("⚙️ Settings panel coming soon!", severity="information")
-
-    def remove_pressed_class(self, button: Button) -> None:
-        """Remove pressed visual feedback class."""
-        button.remove_class("pressed")
-</file>
-
-<file path="ingest_pipeline/cli/tui/screens/dialogs.py">
-"""Dialog screens for confirmations and user interactions."""
-
-from pathlib import Path
-from typing import TYPE_CHECKING
-
-from textual.app import ComposeResult
-from textual.binding import Binding
-from textual.containers import Container, Horizontal
-from textual.screen import ModalScreen, Screen
-from textual.widgets import Button, Footer, Header, LoadingIndicator, RichLog, Static
-from typing_extensions import override
-
-from ..models import CollectionInfo
-
-if TYPE_CHECKING:
-    from .dashboard import CollectionOverviewScreen
-    from .documents import DocumentManagementScreen
-
-
-class ConfirmDeleteScreen(Screen[None]):
-    """Screen for confirming collection deletion."""
-
-    collection: CollectionInfo
-    parent_screen: "CollectionOverviewScreen"
-
-    BINDINGS = [
-        Binding("escape", "app.pop_screen", "Cancel"),
-        Binding("y", "confirm_delete", "Yes"),
-        Binding("n", "app.pop_screen", "No"),
-        Binding("enter", "confirm_delete", "Confirm"),
-    ]
-
-    def __init__(self, collection: CollectionInfo, parent_screen: "CollectionOverviewScreen"):
-        super().__init__()
-        self.collection = collection
-        self.parent_screen = parent_screen
-
-    @override
-    def compose(self) -> ComposeResult:
-        yield Header()
-        yield Container(
-            Static("⚠️  Confirm Deletion", classes="title warning"),
-            Static(f"Are you sure you want to delete collection '{self.collection['name']}'?"),
-            Static(f"Backend: {self.collection['backend']}"),
-            Static(f"Documents: {self.collection['count']:,}"),
-            Static("This action cannot be undone!", classes="warning"),
-            Static("Press Y to confirm, N or Escape to cancel", classes="subtitle"),
-            Horizontal(
-                Button("✅ Yes, Delete (Y)", id="yes_btn", variant="error"),
-                Button("❌ Cancel (N)", id="no_btn", variant="default"),
-                classes="action_buttons",
-            ),
-            classes="main_container center",
-        )
-        yield Footer()
-
-    def on_mount(self) -> None:
-        """Initialize the screen with focus on cancel button for safety."""
-        self.query_one("#no_btn").focus()
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle button presses."""
-        if event.button.id == "yes_btn":
-            self.action_confirm_delete()
-        elif event.button.id == "no_btn":
-            self.app.pop_screen()
-
-    def action_confirm_delete(self) -> None:
-        """Confirm deletion."""
-        self.run_worker(self.delete_collection())
-
-    async def delete_collection(self) -> None:
-        """Delete the collection."""
-        try:
-            if self.collection["type"] == "weaviate" and self.parent_screen.weaviate:
-                # Delete Weaviate collection
-                if self.parent_screen.weaviate.client:
-                    self.parent_screen.weaviate.client.collections.delete(self.collection["name"])
-                self.notify(
-                    f"Deleted Weaviate collection: {self.collection['name']}",
-                    severity="information",
-                )
-            else:
-                # Use the dashboard's method to get the appropriate storage backend
-                storage_backend = self.parent_screen._get_storage_for_collection(self.collection)
-                if not storage_backend:
-                    self.notify(
-                        f"❌ No storage backend available for {self.collection['type']} collection: {self.collection['name']}",
-                        severity="error",
-                    )
-                    self.app.pop_screen()
-                    return
-
-                # Check if the storage backend supports collection deletion
-                if not hasattr(storage_backend, 'delete_collection'):
-                    self.notify(
-                        f"❌ Collection deletion not supported for {self.collection['type']} backend",
-                        severity="error",
-                    )
-                    self.app.pop_screen()
-                    return
-
-                # Delete the collection using the appropriate backend
-                # Ensure we use the exact collection name, not any default from storage config
-                collection_name = str(self.collection["name"])
-                collection_type = str(self.collection["type"])
-
-                self.notify(f"Deleting {collection_type} collection: {collection_name}...", severity="information")
-
-                # Use the standard delete_collection method for all backends
-                if hasattr(storage_backend, 'delete_collection'):
-                    success = await storage_backend.delete_collection(collection_name)
-                else:
-                    self.notify("❌ Backend does not support collection deletion", severity="error")
-                    self.app.pop_screen()
-                    return
-                if success:
-                    self.notify(
-                        f"✅ Successfully deleted {self.collection['type']} collection: {self.collection['name']}",
-                        severity="information",
-                        timeout=3.0,
-                    )
-                else:
-                    self.notify(
-                        f"❌ Failed to delete {self.collection['type']} collection: {self.collection['name']}",
-                        severity="error",
-                    )
-                    # Don't refresh if deletion failed
-                    self.app.pop_screen()
-                    return
-
-            # Refresh parent screen after a short delay to ensure deletion is processed
-            self.call_later(lambda _: self.parent_screen.refresh_collections(), 0.5)  # 500ms delay
-            self.app.pop_screen()
-
-        except Exception as e:
-            self.notify(f"Failed to delete collection: {e}", severity="error", markup=False)
-
-
-
-class ConfirmDocumentDeleteScreen(Screen[None]):
-    """Screen for confirming document deletion."""
-
-    doc_ids: list[str]
-    collection: CollectionInfo
-    parent_screen: "DocumentManagementScreen"
-
-    BINDINGS = [
-        Binding("escape", "app.pop_screen", "Cancel"),
-        Binding("y", "confirm_delete", "Yes"),
-        Binding("n", "app.pop_screen", "No"),
-        Binding("enter", "confirm_delete", "Confirm"),
-    ]
-
-    def __init__(
-        self,
-        doc_ids: list[str],
-        collection: CollectionInfo,
-        parent_screen: "DocumentManagementScreen",
-    ):
-        super().__init__()
-        self.doc_ids = doc_ids
-        self.collection = collection
-        self.parent_screen = parent_screen
-
-    @override
-    def compose(self) -> ComposeResult:
-        yield Header()
-        yield Container(
-            Static("⚠️  Confirm Document Deletion", classes="title warning"),
-            Static(
-                f"Are you sure you want to delete {len(self.doc_ids)} documents from '{self.collection['name']}'?"
-            ),
-            Static("This action cannot be undone!", classes="warning"),
-            Static("Press Y to confirm, N or Escape to cancel", classes="subtitle"),
-            Horizontal(
-                Button("✅ Yes, Delete (Y)", id="yes_btn", variant="error"),
-                Button("❌ Cancel (N)", id="no_btn", variant="default"),
-                classes="action_buttons",
-            ),
-            LoadingIndicator(id="loading"),
-            classes="main_container center",
-        )
-        yield Footer()
-
-    def on_mount(self) -> None:
-        """Initialize the screen with focus on cancel button for safety."""
-        self.query_one("#loading").display = False
-        self.query_one("#no_btn").focus()
-
-    def on_button_pressed(self, event: Button.Pressed) -> None:
-        """Handle button presses."""
-        if event.button.id == "yes_btn":
-            self.action_confirm_delete()
-        elif event.button.id == "no_btn":
-            self.app.pop_screen()
-
-    def action_confirm_delete(self) -> None:
-        """Confirm deletion."""
-        self.run_worker(self.delete_documents())
-
-    async def delete_documents(self) -> None:
-        """Delete the selected documents."""
-        loading = self.query_one("#loading")
-        loading.display = True
-
-        try:
-            if hasattr(self.parent_screen, 'storage') and self.parent_screen.storage:
-                # Delete documents via storage
-                # The storage should have delete_documents method for weaviate
-                storage = self.parent_screen.storage
-                if hasattr(storage, 'delete_documents'):
-                    results = await storage.delete_documents(
-                    self.doc_ids,
-                    collection_name=self.collection["name"],
-                )
-
-                # Count successful deletions
-                successful = sum(bool(success) for success in results.values())
-                failed = len(results) - successful
-
-                if successful > 0:
-                    self.notify(f"Deleted {successful} documents", severity="information")
-                if failed > 0:
-                    self.notify(f"Failed to delete {failed} documents", severity="error")
-
-                # Clear selection and refresh parent screen
-                self.parent_screen.selected_docs.clear()
-                await self.parent_screen.load_documents()
-                self.app.pop_screen()
-
-        except Exception as e:
-            self.notify(f"Failed to delete documents: {e}", severity="error", markup=False)
-        finally:
-            loading.display = False
-
-
-class LogViewerScreen(ModalScreen[None]):
-    """Display live log output without disrupting the TUI."""
-
-    _log_widget: RichLog | None
-    _log_file: Path | None
-
-    BINDINGS = [
-        Binding("escape", "close", "Close"),
-        Binding("ctrl+l", "close", "Close"),
-        Binding("s", "show_path", "Log File"),
-    ]
-
-    def __init__(self) -> None:
-        super().__init__()
-        self._log_widget = None
-        self._log_file = None
-
-    @override
-    def compose(self) -> ComposeResult:
-        yield Header(show_clock=True)
-        yield Container(
-            Static("📜 Live Application Logs", classes="title"),
-            Static("Logs update in real time. Press S to reveal the log file path.", classes="subtitle"),
-            RichLog(id="log_stream", classes="log-stream", wrap=True, highlight=False),
-            Static("", id="log_file_path", classes="subtitle"),
-            classes="main_container log-viewer-container",
-        )
-        yield Footer()
-
-    def on_mount(self) -> None:
-        """Attach this viewer to the parent application once mounted."""
-        self._log_widget = self.query_one(RichLog)
-
-        if hasattr(self.app, 'attach_log_viewer'):
-            self.app.attach_log_viewer(self)
-
-    def on_unmount(self) -> None:
-        """Detach from the parent application when closed."""
-
-        if hasattr(self.app, 'detach_log_viewer'):
-            self.app.detach_log_viewer(self)
-
-    def _get_log_widget(self) -> RichLog:
-        if self._log_widget is None:
-            self._log_widget = self.query_one(RichLog)
-        if self._log_widget is None:
-            raise RuntimeError("RichLog widget not found")
-        return self._log_widget
-
-    def replace_logs(self, lines: list[str]) -> None:
-        """Replace rendered logs with the provided history."""
-        log_widget = self._get_log_widget()
-        log_widget.clear()
-        for line in lines:
-            log_widget.write(line)
-        log_widget.scroll_end(animate=False)
-
-    def append_logs(self, lines: list[str]) -> None:
-        """Append new log lines to the viewer."""
-        log_widget = self._get_log_widget()
-        for line in lines:
-            log_widget.write(line)
-        log_widget.scroll_end(animate=False)
-
-    def update_log_file(self, log_file: Path | None) -> None:
-        """Update the displayed log file path."""
-        self._log_file = log_file
-        label = self.query_one("#log_file_path", Static)
-        if log_file is None:
-            label.update("Logs are not currently being persisted to disk.")
-        else:
-            label.update(f"Log file: {log_file}")
-
-    def action_close(self) -> None:
-        """Close the log viewer."""
-        self.app.pop_screen()
-
-    def action_show_path(self) -> None:
-        """Reveal the log file location in a notification."""
-        if self._log_file is None:
-            self.notify("File logging is disabled for this session.", severity="warning")
-        else:
-            self.notify(f"Log file available at: {self._log_file}", severity="information", markup=False)
-</file>
-
 <file path="ingest_pipeline/cli/tui/screens/documents.py">
 """Document management screen with enhanced navigation."""
 
@@ -6809,6 +3381,1201 @@ def dashboard() -> None:
     asyncio.run(run_textual_tui())
 </file>
 
+<file path="ingest_pipeline/cli/tui/widgets/firecrawl_config.py">
+"""Firecrawl configuration widgets for advanced scraping options."""
+
+from __future__ import annotations
+
+import json
+from typing import cast
+
+from textual.app import ComposeResult
+from textual.containers import Container, Horizontal
+from textual.validation import Integer
+from textual.widget import Widget
+from textual.widgets import Button, Checkbox, Input, Label, Switch, TextArea
+from typing_extensions import override
+
+from ..models import FirecrawlOptions
+
+
+class ScrapeOptionsForm(Widget):
+    """Form for configuring Firecrawl scraping options."""
+
+    DEFAULT_CSS = """
+    ScrapeOptionsForm {
+        border: solid $border;
+        background: $surface;
+        padding: 1;
+        height: auto;
+    }
+
+    ScrapeOptionsForm .form-section {
+        margin-bottom: 2;
+        padding: 1;
+        border: solid $border-lighten-1;
+        background: $surface-lighten-1;
+    }
+
+    ScrapeOptionsForm .form-row {
+        layout: horizontal;
+        align-items: center;
+        height: auto;
+        margin-bottom: 1;
+    }
+
+    ScrapeOptionsForm .form-label {
+        width: 30%;
+        min-width: 15;
+        text-align: right;
+        padding-right: 2;
+    }
+
+    ScrapeOptionsForm .form-input {
+        width: 70%;
+    }
+
+    ScrapeOptionsForm .checkbox-row {
+        layout: horizontal;
+        align-items: center;
+        height: 3;
+        margin-bottom: 1;
+    }
+
+    ScrapeOptionsForm .checkbox-label {
+        margin-left: 2;
+    }
+    """
+
+    def __init__(
+        self,
+        *,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize scrape options form."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose scrape options form."""
+        yield Label("🔧 Scraping Configuration", classes="form-title")
+
+        # Output formats section
+        yield Container(
+            Label("Output Formats", classes="section-title"),
+            Horizontal(
+                Checkbox("Markdown", id="format_markdown", value=True, classes="checkbox"),
+                Label("Markdown", classes="checkbox-label"),
+                classes="checkbox-row",
+            ),
+            Horizontal(
+                Checkbox("HTML", id="format_html", value=False, classes="checkbox"),
+                Label("HTML", classes="checkbox-label"),
+                classes="checkbox-row",
+            ),
+            Horizontal(
+                Checkbox("Screenshot", id="format_screenshot", value=False, classes="checkbox"),
+                Label("Screenshot", classes="checkbox-label"),
+                classes="checkbox-row",
+            ),
+            classes="form-section",
+        )
+
+        # Content filtering section
+        yield Container(
+            Label("Content Filtering", classes="section-title"),
+            Horizontal(
+                Label("Only Main Content:", classes="form-label"),
+                Switch(id="only_main_content", value=True, classes="form-input"),
+                classes="form-row",
+            ),
+            Horizontal(
+                Label("Include Tags:", classes="form-label"),
+                Input(
+                    placeholder="p, div, article (comma-separated)",
+                    id="include_tags",
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            Horizontal(
+                Label("Exclude Tags:", classes="form-label"),
+                Input(
+                    placeholder="nav, footer, script (comma-separated)",
+                    id="exclude_tags",
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            classes="form-section",
+        )
+
+        # Performance settings section
+        yield Container(
+            Label("Performance Settings", classes="section-title"),
+            Horizontal(
+                Label("Wait Time (ms):", classes="form-label"),
+                Input(
+                    placeholder="0",
+                    id="wait_for",
+                    validators=[Integer(minimum=0, maximum=30000)],
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            classes="form-section",
+        )
+
+    def get_scrape_options(self) -> dict[str, object]:
+        """Get scraping options from form."""
+        # Collect formats
+        formats = []
+        if self.query_one("#format_markdown", Checkbox).value:
+            formats.append("markdown")
+        if self.query_one("#format_html", Checkbox).value:
+            formats.append("html")
+        if self.query_one("#format_screenshot", Checkbox).value:
+            formats.append("screenshot")
+        options: dict[str, object] = {
+            "formats": formats,
+            "only_main_content": self.query_one(
+                "#only_main_content", Switch
+            ).value,
+        }
+        include_tags_input = self.query_one("#include_tags", Input).value
+        if include_tags_input.strip():
+            options["include_tags"] = [tag.strip() for tag in include_tags_input.split(",")]
+
+        exclude_tags_input = self.query_one("#exclude_tags", Input).value
+        if exclude_tags_input.strip():
+            options["exclude_tags"] = [tag.strip() for tag in exclude_tags_input.split(",")]
+
+        # Performance
+        wait_for_input = self.query_one("#wait_for", Input).value
+        if wait_for_input.strip():
+            try:
+                options["wait_for"] = int(wait_for_input)
+            except ValueError:
+                pass
+
+        return options
+
+    def set_scrape_options(self, options: dict[str, object]) -> None:
+        """Set form values from options."""
+        # Set formats
+        formats = options.get("formats", ["markdown"])
+        formats_list = formats if isinstance(formats, list) else []
+        self.query_one("#format_markdown", Checkbox).value = "markdown" in formats_list
+        self.query_one("#format_html", Checkbox).value = "html" in formats_list
+        self.query_one("#format_screenshot", Checkbox).value = "screenshot" in formats_list
+
+        # Set content filtering
+        main_content_val = options.get("only_main_content", True)
+        self.query_one("#only_main_content", Switch).value = bool(main_content_val)
+
+        if include_tags := options.get("include_tags", []):
+            include_list = include_tags if isinstance(include_tags, list) else []
+            self.query_one("#include_tags", Input).value = ", ".join(str(tag) for tag in include_list)
+
+        if exclude_tags := options.get("exclude_tags", []):
+            exclude_list = exclude_tags if isinstance(exclude_tags, list) else []
+            self.query_one("#exclude_tags", Input).value = ", ".join(str(tag) for tag in exclude_list)
+
+        # Set performance
+        wait_for = options.get("wait_for")
+        if wait_for is not None:
+            self.query_one("#wait_for", Input).value = str(wait_for)
+
+
+class MapOptionsForm(Widget):
+    """Form for configuring site mapping options."""
+
+    DEFAULT_CSS = """
+    MapOptionsForm {
+        border: solid $border;
+        background: $surface;
+        padding: 1;
+        height: auto;
+    }
+
+    MapOptionsForm .form-section {
+        margin-bottom: 2;
+        padding: 1;
+        border: solid $border-lighten-1;
+        background: $surface-lighten-1;
+    }
+
+    MapOptionsForm .form-row {
+        layout: horizontal;
+        align-items: center;
+        height: auto;
+        margin-bottom: 1;
+    }
+
+    MapOptionsForm .form-label {
+        width: 30%;
+        min-width: 15;
+        text-align: right;
+        padding-right: 2;
+    }
+
+    MapOptionsForm .form-input {
+        width: 70%;
+    }
+    """
+
+    def __init__(
+        self,
+        *,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize map options form."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose map options form."""
+        yield Label("🗺️ Site Mapping Configuration", classes="form-title")
+
+        # Discovery settings section
+        yield Container(
+            Label("Discovery Settings", classes="section-title"),
+            Horizontal(
+                Label("Search Pattern:", classes="form-label"),
+                Input(
+                    placeholder="docs, api, guide (optional)",
+                    id="search_pattern",
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            Horizontal(
+                Label("Include Subdomains:", classes="form-label"),
+                Switch(id="include_subdomains", value=False, classes="form-input"),
+                classes="form-row",
+            ),
+            classes="form-section",
+        )
+
+        # Limits section
+        yield Container(
+            Label("Crawling Limits", classes="section-title"),
+            Horizontal(
+                Label("Max Pages:", classes="form-label"),
+                Input(
+                    placeholder="100",
+                    id="max_pages",
+                    validators=[Integer(minimum=1, maximum=1000)],
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            Horizontal(
+                Label("Max Depth:", classes="form-label"),
+                Input(
+                    placeholder="5",
+                    id="max_depth",
+                    validators=[Integer(minimum=1, maximum=20)],
+                    classes="form-input",
+                ),
+                classes="form-row",
+            ),
+            classes="form-section",
+        )
+
+    def get_map_options(self) -> dict[str, object]:
+        """Get mapping options from form."""
+        options: dict[str, object] = {}
+
+        # Discovery settings
+        search_pattern = self.query_one("#search_pattern", Input).value
+        if search_pattern.strip():
+            options["search"] = search_pattern.strip()
+
+        options["include_subdomains"] = self.query_one("#include_subdomains", Switch).value
+
+        # Limits
+        max_pages_input = self.query_one("#max_pages", Input).value
+        if max_pages_input.strip():
+            try:
+                options["limit"] = int(max_pages_input)
+            except ValueError:
+                pass
+
+        max_depth_input = self.query_one("#max_depth", Input).value
+        if max_depth_input.strip():
+            try:
+                options["max_depth"] = int(max_depth_input)
+            except ValueError:
+                pass
+
+        return options
+
+    def set_map_options(self, options: dict[str, object]) -> None:
+        """Set form values from options."""
+        if search := options.get("search"):
+            self.query_one("#search_pattern", Input).value = str(search)
+
+        subdomains_val = options.get("include_subdomains", False)
+        self.query_one("#include_subdomains", Switch).value = bool(subdomains_val)
+
+        # Set limits
+        limit = options.get("limit")
+        if limit is not None:
+            self.query_one("#max_pages", Input).value = str(limit)
+
+        max_depth = options.get("max_depth")
+        if max_depth is not None:
+            self.query_one("#max_depth", Input).value = str(max_depth)
+
+
+class ExtractOptionsForm(Widget):
+    """Form for configuring data extraction options."""
+
+    DEFAULT_CSS = """
+    ExtractOptionsForm {
+        border: solid $border;
+        background: $surface;
+        padding: 1;
+        height: auto;
+    }
+
+    ExtractOptionsForm .form-section {
+        margin-bottom: 2;
+        padding: 1;
+        border: solid $border-lighten-1;
+        background: $surface-lighten-1;
+    }
+
+    ExtractOptionsForm .form-row {
+        layout: horizontal;
+        align-items: start;
+        height: auto;
+        margin-bottom: 1;
+    }
+
+    ExtractOptionsForm .form-label {
+        width: 30%;
+        min-width: 15;
+        text-align: right;
+        padding-right: 2;
+        padding-top: 1;
+    }
+
+    ExtractOptionsForm .form-input {
+        width: 70%;
+    }
+
+    ExtractOptionsForm .text-area {
+        height: 6;
+    }
+    """
+
+    def __init__(
+        self,
+        *,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize extract options form."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose extract options form."""
+        yield Label("🎯 Data Extraction Configuration", classes="form-title")
+
+        # Extraction prompt section
+        yield Container(
+            Label("AI-Powered Extraction", classes="section-title"),
+            Horizontal(
+                Label("Custom Prompt:", classes="form-label"),
+                TextArea(
+                    placeholder="Extract product names, prices, and descriptions...",
+                    id="extract_prompt",
+                    classes="form-input text-area",
+                ),
+                classes="form-row",
+            ),
+            classes="form-section",
+        )
+
+        # Schema definition section
+        yield Container(
+            Label("Structured Schema (JSON)", classes="section-title"),
+            Horizontal(
+                Label("Schema Definition:", classes="form-label"),
+                TextArea(
+                    placeholder='{"product_name": "string", "price": "number", "description": "string"}',
+                    id="extract_schema",
+                    classes="form-input text-area",
+                ),
+                classes="form-row",
+            ),
+            Container(
+                Label("💡 Tip: Define the structure of data you want to extract"),
+                classes="help-text",
+            ),
+            classes="form-section",
+        )
+
+        # Schema presets
+        yield Container(
+            Label("Quick Presets", classes="section-title"),
+            Horizontal(
+                Button("📄 Article", id="preset_article", variant="default"),
+                Button("🛍️ Product", id="preset_product", variant="default"),
+                Button("👤 Contact", id="preset_contact", variant="default"),
+                Button("📊 Data", id="preset_data", variant="default"),
+                classes="preset-buttons",
+            ),
+            classes="form-section",
+        )
+
+    def get_extract_options(self) -> dict[str, object]:
+        """Get extraction options from form."""
+        options: dict[str, object] = {}
+
+        # Extract prompt
+        prompt = self.query_one("#extract_prompt", TextArea).text
+        if prompt.strip():
+            options["extract_prompt"] = prompt.strip()
+
+        # Extract schema
+        schema_text = self.query_one("#extract_schema", TextArea).text
+        if schema_text.strip():
+            try:
+                schema = json.loads(schema_text)
+                options["extract_schema"] = schema
+            except json.JSONDecodeError:
+                # Invalid JSON, skip schema
+                pass
+
+        return options
+
+    def set_extract_options(self, options: dict[str, object]) -> None:
+        """Set form values from options."""
+        if prompt := options.get("extract_prompt"):
+            self.query_one("#extract_prompt", TextArea).text = str(prompt)
+
+        if schema := options.get("extract_schema"):
+            import json
+
+            self.query_one("#extract_schema", TextArea).text = json.dumps(schema, indent=2)
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle preset button presses."""
+        schema_widget = self.query_one("#extract_schema", TextArea)
+        prompt_widget = self.query_one("#extract_prompt", TextArea)
+
+        if event.button.id == "preset_article":
+            schema_widget.text = """{
+  "title": "string",
+  "author": "string",
+  "date": "string",
+  "content": "string",
+  "tags": ["string"]
+}"""
+            prompt_widget.text = "Extract article title, author, publication date, main content, and associated tags"
+
+        elif event.button.id == "preset_product":
+            schema_widget.text = """{
+  "name": "string",
+  "price": "number",
+  "description": "string",
+  "category": "string",
+  "availability": "string"
+}"""
+            prompt_widget.text = "Extract product name, price, description, category, and availability status"
+
+        elif event.button.id == "preset_contact":
+            schema_widget.text = """{
+  "name": "string",
+  "email": "string",
+  "phone": "string",
+  "company": "string",
+  "position": "string"
+}"""
+            prompt_widget.text = "Extract contact information including name, email, phone, company, and position"
+
+        elif event.button.id == "preset_data":
+            schema_widget.text = """{
+  "metrics": [{"name": "string", "value": "number", "unit": "string"}],
+  "tables": [{"headers": ["string"], "rows": [["string"]]}]
+}"""
+            prompt_widget.text = "Extract numerical data, metrics, and tabular information"
+
+
+class FirecrawlConfigWidget(Widget):
+    """Complete Firecrawl configuration widget with tabbed interface."""
+
+    DEFAULT_CSS = """
+    FirecrawlConfigWidget {
+        border: solid $border;
+        background: $surface;
+        height: 100%;
+        padding: 1;
+    }
+
+    FirecrawlConfigWidget .config-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+        margin: -1 -1 1 -1;
+    }
+
+    FirecrawlConfigWidget .tab-buttons {
+        dock: top;
+        height: 3;
+        layout: horizontal;
+        margin-bottom: 1;
+    }
+
+    FirecrawlConfigWidget .tab-button {
+        width: 1fr;
+        margin-right: 1;
+    }
+
+    FirecrawlConfigWidget .tab-content {
+        height: 1fr;
+        overflow: auto;
+    }
+
+    FirecrawlConfigWidget .actions {
+        dock: bottom;
+        height: 3;
+        layout: horizontal;
+        align: center;
+        margin-top: 1;
+    }
+    """
+
+    def __init__(
+        self,
+        *,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize Firecrawl config widget."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+        self.current_tab = "scrape"
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose config widget layout."""
+        yield Container(
+            Label("🔥 Firecrawl Configuration", classes="config-header"),
+            Horizontal(
+                Button("🔧 Scraping", id="tab_scrape", variant="primary", classes="tab-button"),
+                Button("🗺️ Mapping", id="tab_map", variant="default", classes="tab-button"),
+                Button("🎯 Extraction", id="tab_extract", variant="default", classes="tab-button"),
+                classes="tab-buttons",
+            ),
+            Container(
+                ScrapeOptionsForm(id="scrape_form"),
+                classes="tab-content",
+            ),
+            Horizontal(
+                Button("📋 Load Preset", id="load_preset", variant="default"),
+                Button("💾 Save Preset", id="save_preset", variant="default"),
+                Button("🔄 Reset", id="reset_config", variant="default"),
+                classes="actions",
+            ),
+        )
+
+    def on_mount(self) -> None:
+        """Initialize widget."""
+        self.show_tab("scrape")
+
+    def show_tab(self, tab_name: str) -> None:
+        """Show specific configuration tab."""
+        self.current_tab = tab_name
+
+        # Update button states
+        for tab in ["scrape", "map", "extract"]:
+            button = self.query_one(f"#tab_{tab}", Button)
+            button.variant = "primary" if tab == tab_name else "default"
+        # Update tab content
+        content_container = self.query_one(".tab-content", Container)
+        content_container.remove_children()
+
+        if tab_name == "extract":
+            content_container.mount(ExtractOptionsForm(id="extract_form"))
+        elif tab_name == "map":
+            content_container.mount(MapOptionsForm(id="map_form"))
+        elif tab_name == "scrape":
+            content_container.mount(ScrapeOptionsForm(id="scrape_form"))
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle button presses."""
+        if event.button.id and event.button.id.startswith("tab_"):
+            tab_name = event.button.id[4:]  # Remove "tab_" prefix
+            self.show_tab(tab_name)
+
+    def get_all_options(self) -> FirecrawlOptions:
+        """Get all configuration options."""
+        options: FirecrawlOptions = {}
+
+        # Try to get options from currently mounted form
+        if self.current_tab == "scrape":
+            try:
+                form = self.query_one("#scrape_form", ScrapeOptionsForm)
+                scrape_opts = form.get_scrape_options()
+                options.update(cast(FirecrawlOptions, scrape_opts))
+            except Exception:
+                pass
+        elif self.current_tab == "map":
+            try:
+                map_form = self.query_one("#map_form", MapOptionsForm)
+                map_opts = map_form.get_map_options()
+                options.update(cast(FirecrawlOptions, map_opts))
+            except Exception:
+                pass
+        elif self.current_tab == "extract":
+            try:
+                extract_form = self.query_one("#extract_form", ExtractOptionsForm)
+                extract_opts = extract_form.get_extract_options()
+                options.update(cast(FirecrawlOptions, extract_opts))
+            except Exception:
+                pass
+
+        return options
+</file>
+
+<file path="ingest_pipeline/cli/tui/widgets/r2r_widgets.py">
+"""R2R-specific widgets for chunk viewing and entity visualization."""
+
+from __future__ import annotations
+
+from typing import Any
+
+from textual import work
+from textual.app import ComposeResult
+from textual.containers import Container, Horizontal, Vertical, VerticalScroll
+from textual.widget import Widget
+from textual.widgets import Button, DataTable, Label, Markdown, ProgressBar, Static, Tree
+from typing_extensions import override
+
+from ....storage.r2r.storage import R2RStorage
+from ..models import ChunkInfo, EntityInfo
+
+
+class ChunkViewer(Widget):
+    """Widget for viewing document chunks with navigation."""
+
+    DEFAULT_CSS = """
+    ChunkViewer {
+        border: solid $border;
+        background: $surface;
+        height: 100%;
+    }
+
+    ChunkViewer .chunk-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+    }
+
+    ChunkViewer .chunk-navigation {
+        dock: top;
+        height: 3;
+        background: $surface-lighten-1;
+        padding: 1;
+    }
+
+    ChunkViewer .chunk-content {
+        height: 1fr;
+        padding: 1;
+        overflow: auto;
+    }
+
+    ChunkViewer .chunk-footer {
+        dock: bottom;
+        height: 3;
+        background: $surface-darken-1;
+        padding: 1;
+    }
+    """
+
+    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
+        """Initialize chunk viewer."""
+        super().__init__(**kwargs)
+        self.r2r_storage: R2RStorage = r2r_storage
+        self.document_id: str = document_id
+        self.chunks: list[ChunkInfo] = []
+        self.current_chunk_index: int = 0
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose chunk viewer layout."""
+        yield Container(
+            Static("📄 Document Chunks", classes="chunk-header"),
+            Horizontal(
+                Button("◀ Previous", id="prev_chunk", variant="default"),
+                Static("Chunk 1 of 1", id="chunk_info"),
+                Button("Next ▶", id="next_chunk", variant="default"),
+                classes="chunk-navigation",
+            ),
+            VerticalScroll(
+                Markdown("", id="chunk_content"),
+                classes="chunk-content",
+            ),
+            Container(
+                Static("Loading chunks...", id="chunk_status"),
+                classes="chunk-footer",
+            ),
+        )
+
+    def on_mount(self) -> None:
+        """Initialize chunk viewer."""
+        self.load_chunks()
+
+    @work(exclusive=True)
+    async def load_chunks(self) -> None:
+        """Load document chunks."""
+        try:
+            chunks_data = await self.r2r_storage.get_document_chunks(self.document_id)
+            self.chunks = []
+
+            for chunk_data in chunks_data:
+                chunk_info: ChunkInfo = {
+                    "id": str(chunk_data.get("id", "")),
+                    "document_id": self.document_id,
+                    "content": str(chunk_data.get("text", "")),
+                    "start_index": (lambda si: int(si) if isinstance(si, (int, str)) else 0)(chunk_data.get("start_index", 0)),
+                    "end_index": (lambda ei: int(ei) if isinstance(ei, (int, str)) else 0)(chunk_data.get("end_index", 0)),
+                    "metadata": (
+                        dict(metadata_val) if (metadata_val := chunk_data.get("metadata")) and isinstance(metadata_val, dict) else {}
+                    ),
+                }
+                self.chunks.append(chunk_info)
+
+            if self.chunks:
+                self.current_chunk_index = 0
+                self.update_chunk_display()
+            else:
+                self.query_one("#chunk_status", Static).update("No chunks found")
+
+        except Exception as e:
+            self.query_one("#chunk_status", Static).update(f"Error loading chunks: {e}")
+
+    def update_chunk_display(self) -> None:
+        """Update chunk display with current chunk."""
+        if not self.chunks:
+            return
+
+        chunk = self.chunks[self.current_chunk_index]
+
+        # Update content
+        content_widget = self.query_one("#chunk_content", Markdown)
+        content_widget.update(chunk["content"])
+
+        # Update navigation info
+        chunk_info = self.query_one("#chunk_info", Static)
+        chunk_info.update(f"Chunk {self.current_chunk_index + 1} of {len(self.chunks)}")
+
+        # Update status
+        status_widget = self.query_one("#chunk_status", Static)
+        status_widget.update(
+            f"Chunk {chunk['id']} | "
+            f"Range: {chunk['start_index']}-{chunk['end_index']} | "
+            f"Length: {len(chunk['content'])} chars"
+        )
+
+        # Update button states
+        prev_btn = self.query_one("#prev_chunk", Button)
+        next_btn = self.query_one("#next_chunk", Button)
+        prev_btn.disabled = self.current_chunk_index == 0
+        next_btn.disabled = self.current_chunk_index >= len(self.chunks) - 1
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle button presses."""
+        if event.button.id == "prev_chunk" and self.current_chunk_index > 0:
+            self.current_chunk_index -= 1
+            self.update_chunk_display()
+        elif event.button.id == "next_chunk" and self.current_chunk_index < len(self.chunks) - 1:
+            self.current_chunk_index += 1
+            self.update_chunk_display()
+
+
+class EntityGraph(Widget):
+    """Widget for visualizing extracted entities and relationships."""
+
+    DEFAULT_CSS = """
+    EntityGraph {
+        border: solid $border;
+        background: $surface;
+        height: 100%;
+    }
+
+    EntityGraph .entity-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+    }
+
+    EntityGraph .entity-tree {
+        height: 1fr;
+        overflow: auto;
+    }
+
+    EntityGraph .entity-details {
+        dock: bottom;
+        height: 8;
+        background: $surface-lighten-1;
+        padding: 1;
+        border-top: solid $border;
+    }
+    """
+
+    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
+        """Initialize entity graph."""
+        super().__init__(**kwargs)
+        self.r2r_storage: R2RStorage = r2r_storage
+        self.document_id: str = document_id
+        self.entities: list[EntityInfo] = []
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose entity graph layout."""
+        yield Container(
+            Static("🕸️ Entity Graph", classes="entity-header"),
+            Tree("Entities", id="entity_tree", classes="entity-tree"),
+            VerticalScroll(
+                Label("Entity Details"),
+                Static("Select an entity to view details", id="entity_details"),
+                classes="entity-details",
+            ),
+        )
+
+    def on_mount(self) -> None:
+        """Initialize entity graph."""
+        self.load_entities()
+
+    @work(exclusive=True)
+    async def load_entities(self) -> None:
+        """Load entities from document."""
+        try:
+            entities_data = await self.r2r_storage.extract_entities(self.document_id)
+            self.entities = []
+
+            # Parse entities from R2R response
+            entities_list = entities_data.get("entities", [])
+            if not isinstance(entities_list, list):
+                entities_list = []
+            for entity_data in entities_list:
+                entity_info: EntityInfo = {
+                    "id": str(entity_data.get("id", "")),
+                    "name": str(entity_data.get("name", "")),
+                    "type": str(entity_data.get("type", "unknown")),
+                    "confidence": float(entity_data.get("confidence", 0.0)),
+                    "metadata": dict(entity_data.get("metadata", {})),
+                }
+                self.entities.append(entity_info)
+
+            self.populate_entity_tree()
+
+        except Exception as e:
+            details_widget = self.query_one("#entity_details", Static)
+            details_widget.update(f"Error loading entities: {e}")
+
+    def populate_entity_tree(self) -> None:
+        """Populate the entity tree."""
+        tree = self.query_one("#entity_tree", Tree)
+        tree.clear()
+
+        if not self.entities:
+            tree.root.add_leaf("No entities found")
+            return
+
+        # Group entities by type
+        entities_by_type: dict[str, list[EntityInfo]] = {}
+        for entity in self.entities:
+            entity_type = entity["type"]
+            if entity_type not in entities_by_type:
+                entities_by_type[entity_type] = []
+            entities_by_type[entity_type].append(entity)
+
+        # Add entities to tree grouped by type
+        for entity_type, type_entities in entities_by_type.items():
+            type_node = tree.root.add(f"{entity_type.title()} ({len(type_entities)})")
+            for entity in type_entities:
+                confidence_pct = int(entity["confidence"] * 100)
+                entity_node = type_node.add_leaf(f"{entity['name']} ({confidence_pct}%)")
+                entity_node.data = entity
+
+        tree.root.expand()
+
+    def on_tree_node_selected(self, event: Tree.NodeSelected[EntityInfo]) -> None:
+        """Handle entity selection."""
+        if hasattr(event.node, "data") and event.node.data:
+            entity = event.node.data
+            self.show_entity_details(entity)
+
+    def show_entity_details(self, entity: EntityInfo) -> None:
+        """Show detailed information about an entity."""
+        details_widget = self.query_one("#entity_details", Static)
+
+        details_text = f"""**Entity:** {entity['name']}
+**Type:** {entity['type']}
+**Confidence:** {entity['confidence']:.2%}
+**ID:** {entity['id']}
+
+**Metadata:**
+"""
+        for key, value in entity["metadata"].items():
+            details_text += f"- **{key}:** {value}\n"
+
+        details_widget.update(details_text)
+
+
+class CollectionStats(Widget):
+    """Widget for showing R2R-specific collection statistics."""
+
+    DEFAULT_CSS = """
+    CollectionStats {
+        border: solid $border;
+        background: $surface;
+        height: 100%;
+        padding: 1;
+    }
+
+    CollectionStats .stats-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+        margin: -1 -1 1 -1;
+    }
+
+    CollectionStats .stats-grid {
+        layout: grid;
+        grid-size: 2;
+        grid-columns: 1fr 1fr;
+        grid-gutter: 1;
+        height: auto;
+    }
+
+    CollectionStats .stat-card {
+        background: $surface-lighten-1;
+        border: solid $border;
+        padding: 1;
+        height: auto;
+    }
+
+    CollectionStats .stat-value {
+        color: $primary;
+        text-style: bold;
+        text-align: center;
+    }
+
+    CollectionStats .stat-label {
+        color: $text-muted;
+        text-align: center;
+        margin-top: 1;
+    }
+
+    CollectionStats .progress-section {
+        margin-top: 2;
+    }
+    """
+
+    def __init__(self, r2r_storage: R2RStorage, collection_name: str, **kwargs: Any) -> None:
+        """Initialize collection stats."""
+        super().__init__(**kwargs)
+        self.r2r_storage: R2RStorage = r2r_storage
+        self.collection_name: str = collection_name
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose stats layout."""
+        yield Container(
+            Static(f"📊 {self.collection_name} Statistics", classes="stats-header"),
+            Container(
+                Container(
+                    Static("0", id="document_count", classes="stat-value"),
+                    Static("Documents", classes="stat-label"),
+                    classes="stat-card",
+                ),
+                Container(
+                    Static("0", id="chunk_count", classes="stat-value"),
+                    Static("Chunks", classes="stat-label"),
+                    classes="stat-card",
+                ),
+                Container(
+                    Static("0", id="entity_count", classes="stat-value"),
+                    Static("Entities", classes="stat-label"),
+                    classes="stat-card",
+                ),
+                Container(
+                    Static("0 MB", id="storage_size", classes="stat-value"),
+                    Static("Storage Used", classes="stat-label"),
+                    classes="stat-card",
+                ),
+                classes="stats-grid",
+            ),
+            Container(
+                Label("Processing Progress"),
+                ProgressBar(id="processing_progress", total=100, show_eta=False),
+                Static("Idle", id="processing_status"),
+                classes="progress-section",
+            ),
+        )
+
+    def on_mount(self) -> None:
+        """Initialize stats display."""
+        self.refresh_stats()
+
+    @work(exclusive=True)
+    async def refresh_stats(self) -> None:
+        """Refresh collection statistics."""
+        try:
+            # Get basic document count
+            doc_count = await self.r2r_storage.count(collection_name=self.collection_name)
+            self.query_one("#document_count", Static).update(str(doc_count))
+
+            # Estimate other stats (these would need real implementation)
+            estimated_chunks = doc_count * 5  # Rough estimate
+            estimated_entities = doc_count * 10  # Rough estimate
+            estimated_size_mb = doc_count * 0.05  # Rough estimate
+
+            self.query_one("#chunk_count", Static).update(str(estimated_chunks))
+            self.query_one("#entity_count", Static).update(str(estimated_entities))
+            self.query_one("#storage_size", Static).update(f"{estimated_size_mb:.1f} MB")
+
+            # Update progress (would be real-time in actual implementation)
+            progress_bar = self.query_one("#processing_progress", ProgressBar)
+            progress_bar.progress = 100  # Assume complete for now
+
+            status_widget = self.query_one("#processing_status", Static)
+            status_widget.update("All documents processed")
+
+        except Exception as e:
+            self.query_one("#processing_status", Static).update(f"Error: {e}")
+
+
+class DocumentOverview(Widget):
+    """Widget for comprehensive document overview and statistics."""
+
+    DEFAULT_CSS = """
+    DocumentOverview {
+        layout: vertical;
+        height: 100%;
+    }
+
+    DocumentOverview .overview-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+    }
+
+    DocumentOverview .overview-content {
+        height: 1fr;
+        layout: horizontal;
+    }
+
+    DocumentOverview .overview-left {
+        width: 50%;
+        padding: 1;
+    }
+
+    DocumentOverview .overview-right {
+        width: 50%;
+        padding: 1;
+    }
+
+    DocumentOverview .info-table {
+        height: auto;
+        margin-bottom: 2;
+    }
+    """
+
+    def __init__(self, r2r_storage: R2RStorage, document_id: str, **kwargs: Any) -> None:
+        """Initialize document overview."""
+        super().__init__(**kwargs)
+        self.r2r_storage: R2RStorage = r2r_storage
+        self.document_id: str = document_id
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose overview layout."""
+        yield Container(
+            Static("📋 Document Overview", classes="overview-header"),
+            Horizontal(
+                Vertical(
+                    Label("Document Information"),
+                    DataTable[str](id="doc_info_table", classes="info-table"),
+                    Label("Processing Statistics"),
+                    DataTable[str](id="stats_table", classes="info-table"),
+                    classes="overview-left",
+                ),
+                Vertical(
+                    ChunkViewer(self.r2r_storage, self.document_id),
+                    classes="overview-right",
+                ),
+                classes="overview-content",
+            ),
+        )
+
+    def on_mount(self) -> None:
+        """Initialize overview."""
+        self.load_overview()
+
+    @work(exclusive=True)
+    async def load_overview(self) -> None:
+        """Load comprehensive document overview."""
+        try:
+            overview_data = await self.r2r_storage.get_document_overview(self.document_id)
+
+            # Populate document info table
+            doc_table = self.query_one("#doc_info_table", DataTable)
+            doc_table.add_columns("Property", "Value")
+
+            document_info_raw = overview_data.get("document", {})
+            document_info = document_info_raw if isinstance(document_info_raw, dict) else {}
+            doc_table.add_row("ID", str(document_info.get("id", "N/A")))
+            doc_table.add_row("Title", str(document_info.get("title", "N/A")))
+            doc_table.add_row("Created", str(document_info.get("created_at", "N/A")))
+            doc_table.add_row("Modified", str(document_info.get("updated_at", "N/A")))
+
+            # Populate stats table
+            stats_table = self.query_one("#stats_table", DataTable)
+            stats_table.add_columns("Metric", "Count")
+
+            chunk_count = overview_data.get("chunk_count", 0)
+            stats_table.add_row("Chunks", str(chunk_count))
+            stats_table.add_row("Characters", str(len(str(document_info.get("content", "")))))
+
+        except Exception as e:
+            # Handle error by showing minimal info
+            doc_table = self.query_one("#doc_info_table", DataTable)
+            doc_table.add_columns("Property", "Value")
+            doc_table.add_row("Error", str(e))
+</file>
+
 <file path="ingest_pipeline/cli/tui/app.py">
 """Main TUI application with enhanced keyboard navigation."""
 
@@ -7126,6 +4893,422 @@ class CollectionManagementApp(App[None]):
         # No else clause needed - just handle our events
 </file>
 
+<file path="ingest_pipeline/cli/tui/layouts.py">
+"""Responsive layout system for TUI applications."""
+
+from __future__ import annotations
+
+from typing import cast
+
+from textual.app import ComposeResult
+from textual.containers import Container, VerticalScroll
+from textual.widget import Widget
+from textual.widgets import Static
+from typing_extensions import override
+
+
+class ResponsiveGrid(Container):
+    """Grid that auto-adjusts based on terminal size."""
+
+    DEFAULT_CSS: str = """
+    ResponsiveGrid {
+        layout: grid;
+        grid-size: 1;
+        grid-columns: 1fr;
+        grid-rows: auto;
+        grid-gutter: 1;
+        padding: 1;
+    }
+
+    ResponsiveGrid.two-column {
+        grid-size: 2;
+        grid-columns: 1fr 1fr;
+    }
+
+    ResponsiveGrid.three-column {
+        grid-size: 3;
+        grid-columns: 1fr 1fr 1fr;
+    }
+
+    ResponsiveGrid.auto-fit {
+        grid-columns: repeat(auto-fit, minmax(20, 1fr));
+    }
+
+    ResponsiveGrid.compact {
+        grid-gutter: 0;
+        padding: 0;
+    }
+    """
+
+    def __init__(
+        self,
+        *children: Widget,
+        columns: int = 1,
+        auto_fit: bool = False,
+        compact: bool = False,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize responsive grid."""
+        super().__init__(*children, name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+        self._columns: int = columns
+        self._auto_fit: bool = auto_fit
+        self._compact: bool = compact
+
+    def on_mount(self) -> None:
+        """Apply responsive classes based on configuration."""
+        widget = cast(Widget, self)
+        if self._auto_fit:
+            widget.add_class("auto-fit")
+        elif self._columns == 2:
+            widget.add_class("two-column")
+        elif self._columns == 3:
+            widget.add_class("three-column")
+
+        if self._compact:
+            widget.add_class("compact")
+
+    def on_resize(self) -> None:
+        """Adjust layout based on terminal size."""
+        if self._auto_fit:
+            # Let CSS handle auto-fit
+            return
+
+        widget = cast(Widget, self)
+        terminal_width = widget.size.width
+        if terminal_width < 60:
+            # Force single column on narrow terminals
+            widget.remove_class("two-column", "three-column")
+            widget.styles.grid_size_columns = 1
+            widget.styles.grid_columns = "1fr"
+        elif terminal_width < 100 and self._columns > 2:
+            # Force two columns on medium terminals
+            widget.remove_class("three-column")
+            widget.add_class("two-column")
+            widget.styles.grid_size_columns = 2
+            widget.styles.grid_columns = "1fr 1fr"
+        elif self._columns == 2:
+            widget.add_class("two-column")
+        elif self._columns == 3:
+            widget.add_class("three-column")
+
+
+class CollapsibleSidebar(Container):
+    """Sidebar that can be collapsed to save space."""
+
+    DEFAULT_CSS: str = """
+    CollapsibleSidebar {
+        dock: left;
+        width: 25%;
+        min-width: 20;
+        max-width: 40;
+        background: $surface;
+        border-right: solid $border;
+        padding: 1;
+        transition: width 300ms;
+    }
+
+    CollapsibleSidebar.collapsed {
+        width: 3;
+        min-width: 3;
+        overflow: hidden;
+    }
+
+    CollapsibleSidebar.collapsed > * {
+        display: none;
+    }
+
+    CollapsibleSidebar .sidebar-toggle {
+        dock: top;
+        height: 1;
+        background: $primary;
+        color: $text;
+        text-align: center;
+        margin-bottom: 1;
+    }
+
+    CollapsibleSidebar .sidebar-content {
+        height: 1fr;
+        overflow-y: auto;
+    }
+    """
+
+    def __init__(
+        self,
+        *children: Widget,
+        collapsed: bool = False,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize collapsible sidebar."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+        self._collapsed: bool = collapsed
+        self._children: tuple[Widget, ...] = children
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose sidebar with toggle and content."""
+        yield Static("☰", classes="sidebar-toggle")
+        with VerticalScroll(classes="sidebar-content"):
+            yield from self._children
+
+    def on_mount(self) -> None:
+        """Apply initial collapsed state."""
+        if self._collapsed:
+            cast(Widget, self).add_class("collapsed")
+
+    def on_click(self) -> None:
+        """Toggle sidebar when clicked."""
+        self.toggle()
+
+    def toggle(self) -> None:
+        """Toggle sidebar collapsed state."""
+        self._collapsed = not self._collapsed
+        widget = cast(Widget, self)
+        if self._collapsed:
+            widget.add_class("collapsed")
+        else:
+            widget.remove_class("collapsed")
+
+    def expand_sidebar(self) -> None:
+        """Expand sidebar."""
+        if self._collapsed:
+            self.toggle()
+
+    def collapse_sidebar(self) -> None:
+        """Collapse sidebar."""
+        if not self._collapsed:
+            self.toggle()
+
+
+class TabularLayout(Container):
+    """Optimized layout for data tables with optional sidebar."""
+
+    DEFAULT_CSS: str = """
+    TabularLayout {
+        layout: horizontal;
+        height: 100%;
+    }
+
+    TabularLayout .main-content {
+        width: 1fr;
+        height: 100%;
+        layout: vertical;
+    }
+
+    TabularLayout .table-container {
+        height: 1fr;
+        overflow: auto;
+        border: solid $border;
+        background: $surface;
+    }
+
+    TabularLayout .table-header {
+        dock: top;
+        height: 3;
+        background: $primary;
+        color: $text;
+        padding: 1;
+    }
+
+    TabularLayout .table-footer {
+        dock: bottom;
+        height: 3;
+        background: $surface-lighten-1;
+        padding: 1;
+        border-top: solid $border;
+    }
+    """
+
+    def __init__(
+        self,
+        table_widget: Widget,
+        header_content: Widget | None = None,
+        footer_content: Widget | None = None,
+        sidebar_content: Widget | None = None,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize tabular layout."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+        self.table_widget: Widget = table_widget
+        self.header_content: Widget | None = header_content
+        self.footer_content: Widget | None = footer_content
+        self.sidebar_content: Widget | None = sidebar_content
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose layout with optional sidebar."""
+        if self.sidebar_content:
+            yield CollapsibleSidebar(self.sidebar_content)
+
+        with Container(classes="main-content"):
+            if self.header_content:
+                yield Container(self.header_content, classes="table-header")
+
+            yield Container(self.table_widget, classes="table-container")
+
+            if self.footer_content:
+                yield Container(self.footer_content, classes="table-footer")
+
+
+class CardLayout(ResponsiveGrid):
+    """Grid layout optimized for card-based content."""
+
+    DEFAULT_CSS: str = """
+    CardLayout {
+        grid-gutter: 2;
+        padding: 2;
+    }
+
+    CardLayout .card {
+        background: $surface;
+        border: solid $border;
+        border-radius: 1;
+        padding: 2;
+        height: auto;
+        min-height: 10;
+    }
+
+    CardLayout .card:hover {
+        border: solid $accent;
+        background: $surface-lighten-1;
+    }
+
+    CardLayout .card:focus {
+        border: solid $primary;
+    }
+
+    CardLayout .card-header {
+        dock: top;
+        height: 3;
+        background: $primary-lighten-1;
+        color: $text;
+        padding: 1;
+        margin: -2 -2 1 -2;
+        border-radius: 1 1 0 0;
+    }
+
+    CardLayout .card-content {
+        height: 1fr;
+        overflow: auto;
+    }
+
+    CardLayout .card-footer {
+        dock: bottom;
+        height: 3;
+        background: $surface-darken-1;
+        padding: 1;
+        margin: 1 -2 -2 -2;
+        border-radius: 0 0 1 1;
+    }
+    """
+
+    def __init__(
+        self,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize card layout with default settings for cards."""
+        # Default to auto-fit cards with minimum width
+        super().__init__(auto_fit=True, name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+
+
+class SplitPane(Container):
+    """Resizable split pane layout."""
+
+    DEFAULT_CSS: str = """
+    SplitPane {
+        layout: horizontal;
+        height: 100%;
+    }
+
+    SplitPane.vertical {
+        layout: vertical;
+    }
+
+    SplitPane .left-pane,
+    SplitPane .top-pane {
+        width: 50%;
+        height: 50%;
+        background: $surface;
+        border-right: solid $border;
+        border-bottom: solid $border;
+    }
+
+    SplitPane .right-pane,
+    SplitPane .bottom-pane {
+        width: 50%;
+        height: 50%;
+        background: $surface;
+    }
+
+    SplitPane .splitter {
+        width: 1;
+        height: 1;
+        background: $border;
+    }
+
+    SplitPane.vertical .splitter {
+        width: 100%;
+        height: 1;
+    }
+    """
+
+    def __init__(
+        self,
+        left_content: Widget,
+        right_content: Widget,
+        vertical: bool = False,
+        split_ratio: float = 0.5,
+        name: str | None = None,
+        id: str | None = None,
+        classes: str | None = None,
+        disabled: bool = False,
+        markup: bool = True,
+    ) -> None:
+        """Initialize split pane."""
+        super().__init__(name=name, id=id, classes=classes, disabled=disabled, markup=markup)
+        self._left_content: Widget = left_content
+        self._right_content: Widget = right_content
+        self._vertical: bool = vertical
+        self._split_ratio: float = split_ratio
+
+    @override
+    def compose(self) -> ComposeResult:
+        """Compose split pane layout."""
+        if self._vertical:
+            cast(Widget, self).add_class("vertical")
+
+        pane_classes = ("top-pane", "bottom-pane") if self._vertical else ("left-pane", "right-pane")
+
+        yield Container(self._left_content, classes=pane_classes[0])
+        yield Static("", classes="splitter")
+        yield Container(self._right_content, classes=pane_classes[1])
+
+    def on_mount(self) -> None:
+        """Apply split ratio."""
+        widget = cast(Widget, self)
+        if self._vertical:
+            widget.query_one(".top-pane").styles.height = f"{self._split_ratio * 100}%"
+            widget.query_one(".bottom-pane").styles.height = f"{(1 - self._split_ratio) * 100}%"
+        else:
+            widget.query_one(".left-pane").styles.width = f"{self._split_ratio * 100}%"
+            widget.query_one(".right-pane").styles.width = f"{(1 - self._split_ratio) * 100}%"
+</file>
+
 <file path="ingest_pipeline/cli/tui/styles.py">
 """Comprehensive theming system for TUI applications with WCAG AA accessibility compliance."""
 
@@ -9584,1161 +7767,6 @@ def configure_prefect(settings: Settings) -> None:
     _prefect_settings_stack = new_stack
 </file>
 
-<file path="ingest_pipeline/config/settings.py">
-"""Application settings and configuration."""
-
-from functools import lru_cache
-from typing import Annotated, Literal
-
-from prefect.variables import Variable
-from pydantic import Field, HttpUrl, model_validator
-from pydantic_settings import BaseSettings, SettingsConfigDict
-
-
-class Settings(BaseSettings):
-    """Application settings."""
-
-    model_config = SettingsConfigDict(
-        env_file=".env",
-        env_file_encoding="utf-8",
-        case_sensitive=False,
-        extra="ignore",  # Ignore extra environment variables
-    )
-
-    # API Keys
-    firecrawl_api_key: str | None = None
-    openwebui_api_key: str | None = None
-    weaviate_api_key: str | None = None
-    r2r_api_key: str | None = None
-
-    # Endpoints
-    llm_endpoint: HttpUrl = HttpUrl("http://llm.lab")
-    weaviate_endpoint: HttpUrl = HttpUrl("http://weaviate.yo")
-    openwebui_endpoint: HttpUrl = HttpUrl("http://chat.lab")  # This will be the API URL
-    firecrawl_endpoint: HttpUrl = HttpUrl("http://crawl.lab:30002")
-    r2r_endpoint: HttpUrl | None = Field(default=None, alias="r2r_api_url")
-
-    # Model Configuration
-    embedding_model: str = "ollama/bge-m3:latest"
-    embedding_dimension: int = 1024
-
-    # Ingestion Settings
-    default_batch_size: Annotated[int, Field(gt=0, le=500)] = 50
-    max_file_size: int = 1_000_000
-    max_crawl_depth: Annotated[int, Field(ge=1, le=20)] = 5
-    max_crawl_pages: Annotated[int, Field(ge=1, le=1000)] = 100
-
-    # Storage Settings
-    default_storage_backend: Literal["weaviate", "open_webui", "r2r"] = "weaviate"
-    default_collection_prefix: str = "docs"
-
-    # Prefect Settings
-    prefect_api_url: HttpUrl | None = None
-    prefect_api_key: str | None = None
-    prefect_work_pool: str = "default"
-
-    # Scheduling Defaults
-    default_schedule_interval: Annotated[int, Field(ge=1, le=10080)] = 60  # Max 1 week
-
-    # Performance Settings
-    max_concurrent_tasks: Annotated[int, Field(ge=1, le=20)] = 5
-    request_timeout: Annotated[int, Field(ge=10, le=300)] = 60
-
-    # Logging
-    log_level: Literal["DEBUG", "INFO", "WARNING", "ERROR"] = "INFO"
-
-    def get_storage_endpoint(self, backend: str) -> HttpUrl:
-        """
-        Get endpoint for storage backend.
-
-        Args:
-            backend: Storage backend name
-
-        Returns:
-            Endpoint URL
-
-        Raises:
-            ValueError: If backend is unknown or R2R endpoint not configured
-        """
-        endpoints = {
-            "weaviate": self.weaviate_endpoint,
-            "open_webui": self.openwebui_endpoint,
-        }
-
-        if backend in endpoints:
-            return endpoints[backend]
-        elif backend == "r2r":
-            if not self.r2r_endpoint:
-                raise ValueError(
-                    "R2R_API_URL must be set in environment variables. "
-                    "This should have been caught during settings validation."
-                )
-            return self.r2r_endpoint
-        else:
-            raise ValueError(f"Unknown backend: {backend}. Supported: weaviate, open_webui, r2r")
-
-    def get_api_key(self, service: str) -> str | None:
-        """
-        Get API key for service.
-
-        Args:
-            service: Service name
-
-        Returns:
-            API key or None
-        """
-        service_map = {
-            "firecrawl": self.firecrawl_api_key,
-            "openwebui": self.openwebui_api_key,
-            "weaviate": self.weaviate_api_key,
-            "r2r": self.r2r_api_key,
-        }
-        return service_map.get(service)
-
-    @model_validator(mode="after")
-    def validate_backend_configuration(self) -> "Settings":
-        """Validate that required configuration is present for the default backend."""
-        backend = self.default_storage_backend
-
-        # Validate R2R backend configuration
-        if backend == "r2r" and not self.r2r_endpoint:
-            raise ValueError(
-                "R2R_API_URL must be set in environment variables when using R2R as default backend"
-            )
-
-        # Validate API key requirements (optional warning for missing keys)
-        required_keys = {
-            "weaviate": ("WEAVIATE_API_KEY", self.weaviate_api_key),
-            "open_webui": ("OPENWEBUI_API_KEY", self.openwebui_api_key),
-            "r2r": ("R2R_API_KEY", self.r2r_api_key),
-        }
-
-        if backend in required_keys:
-            key_name, key_value = required_keys[backend]
-            if not key_value:
-                import warnings
-                warnings.warn(
-                    f"{key_name} not set - authentication may fail for {backend} backend",
-                    UserWarning,
-                    stacklevel=2
-                )
-
-        return self
-
-
-@lru_cache
-def get_settings() -> Settings:
-    """
-    Get cached settings instance.
-
-    Returns:
-        Settings instance
-    """
-    return Settings()
-
-
-class PrefectVariableConfig:
-    """Helper class for managing Prefect variables with fallbacks to settings."""
-
-    def __init__(self) -> None:
-        self._settings = get_settings()
-        self._variable_names = [
-            "default_batch_size", "max_file_size", "max_crawl_depth", "max_crawl_pages",
-            "default_storage_backend", "default_collection_prefix", "max_concurrent_tasks",
-            "request_timeout", "default_schedule_interval"
-        ]
-
-    def _get_fallback_value(self, name: str, default_value: object = None) -> object:
-        """Get fallback value from settings or default."""
-        return default_value or getattr(self._settings, name, default_value)
-
-    def get_with_fallback(self, name: str, default_value: str | int | float | None = None) -> str | int | float | None:
-        """Get variable value with fallback synchronously."""
-        fallback = self._get_fallback_value(name, default_value)
-        # Ensure fallback is a type that Variable expects
-        variable_fallback = str(fallback) if fallback is not None else None
-        try:
-            result = Variable.get(name, default=variable_fallback)
-            # Variable can return various types, convert to our expected types
-            if isinstance(result, (str, int, float)):
-                return result
-            elif result is None:
-                return None
-            else:
-                # Convert other types to string
-                return str(result)
-        except Exception:
-            # Return fallback with proper type
-            if isinstance(fallback, (str, int, float)) or fallback is None:
-                return fallback
-            return str(fallback) if fallback is not None else None
-
-    async def get_with_fallback_async(self, name: str, default_value: str | int | float | None = None) -> str | int | float | None:
-        """Get variable value with fallback asynchronously."""
-        fallback = self._get_fallback_value(name, default_value)
-        variable_fallback = str(fallback) if fallback is not None else None
-        try:
-            result = await Variable.aget(name, default=variable_fallback)
-            # Variable can return various types, convert to our expected types
-            if isinstance(result, (str, int, float)):
-                return result
-            elif result is None:
-                return None
-            else:
-                # Convert other types to string
-                return str(result)
-        except Exception:
-            # Return fallback with proper type
-            if isinstance(fallback, (str, int, float)) or fallback is None:
-                return fallback
-            return str(fallback) if fallback is not None else None
-
-    def get_ingestion_config(self) -> dict[str, str | int | float | None]:
-        """Get all ingestion-related configuration variables synchronously."""
-        return {name: self.get_with_fallback(name) for name in self._variable_names}
-
-    async def get_ingestion_config_async(self) -> dict[str, str | int | float | None]:
-        """Get all ingestion-related configuration variables asynchronously."""
-        result = {}
-        for name in self._variable_names:
-            result[name] = await self.get_with_fallback_async(name)
-        return result
-
-
-@lru_cache
-def get_prefect_config() -> PrefectVariableConfig:
-    """Get cached Prefect variable configuration helper."""
-    return PrefectVariableConfig()
-</file>
-
-<file path="ingest_pipeline/core/models.py">
-"""Core data models with strict typing."""
-
-from datetime import UTC, datetime
-from enum import Enum
-from typing import Annotated, TypedDict
-from uuid import UUID, uuid4
-
-from prefect.blocks.core import Block
-from pydantic import BaseModel, Field, HttpUrl, SecretStr
-
-
-class IngestionStatus(str, Enum):
-    """Status of an ingestion job."""
-
-    PENDING = "pending"
-    IN_PROGRESS = "in_progress"
-    COMPLETED = "completed"
-    PARTIAL = "partial"  # Some documents succeeded, some failed
-    FAILED = "failed"
-    CANCELLED = "cancelled"
-
-
-class StorageBackend(str, Enum):
-    """Available storage backends."""
-
-    WEAVIATE = "weaviate"
-    OPEN_WEBUI = "open_webui"
-    R2R = "r2r"
-
-
-class IngestionSource(str, Enum):
-    """Types of ingestion sources."""
-
-    WEB = "web"
-    REPOSITORY = "repository"
-    DOCUMENTATION = "documentation"
-
-
-class VectorConfig(BaseModel):
-    """Configuration for vectorization."""
-
-    model: str = Field(default="ollama/bge-m3:latest")
-    embedding_endpoint: HttpUrl = Field(default=HttpUrl("http://llm.lab"))
-    dimension: int = Field(default=1024)
-    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
-
-
-class StorageConfig(Block):
-    """Configuration for storage backend."""
-
-    _block_type_name = "Storage Configuration"
-    _block_type_slug = "storage-config"
-    _description = "Configures storage backend connections and settings for document ingestion"
-
-    backend: StorageBackend
-    endpoint: HttpUrl
-    api_key: SecretStr | None = Field(default=None)
-    collection_name: str = Field(default="documents")
-    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
-
-
-class FirecrawlConfig(Block):
-    """Configuration for Firecrawl ingestion (operational parameters only)."""
-
-    _block_type_name = "Firecrawl Configuration"
-    _block_type_slug = "firecrawl-config"
-    _description = "Configures Firecrawl web scraping and crawling parameters"
-
-    formats: list[str] = Field(default_factory=lambda: ["markdown", "html"])
-    max_depth: Annotated[int, Field(ge=1, le=20)] = 5
-    limit: Annotated[int, Field(ge=1, le=1000)] = 100
-    only_main_content: bool = Field(default=True)
-    include_subdomains: bool = Field(default=False)
-
-
-class RepomixConfig(Block):
-    """Configuration for Repomix ingestion."""
-
-    _block_type_name = "Repomix Configuration"
-    _block_type_slug = "repomix-config"
-    _description = "Configures repository ingestion patterns and file processing settings"
-
-    include_patterns: list[str] = Field(
-        default_factory=lambda: ["*.py", "*.js", "*.ts", "*.md", "*.yaml", "*.json"]
-    )
-    exclude_patterns: list[str] = Field(
-        default_factory=lambda: ["**/node_modules/**", "**/__pycache__/**", "**/.git/**"]
-    )
-    max_file_size: int = Field(default=1_000_000)  # 1MB
-    respect_gitignore: bool = Field(default=True)
-
-
-class R2RConfig(Block):
-    """Configuration for R2R ingestion."""
-
-    _block_type_name = "R2R Configuration"
-    _block_type_slug = "r2r-config"
-    _description = "Configures R2R-specific ingestion settings including chunking and graph enrichment"
-
-    chunk_size: Annotated[int, Field(ge=100, le=8192)] = 1000
-    chunk_overlap: Annotated[int, Field(ge=0, le=1000)] = 200
-    enable_graph_enrichment: bool = Field(default=False)
-    graph_creation_settings: dict[str, object] | None = Field(default=None)
-
-
-class DocumentMetadataRequired(TypedDict):
-    """Required metadata fields for a document."""
-    source_url: str
-    timestamp: datetime
-    content_type: str
-    word_count: int
-    char_count: int
-
-
-class DocumentMetadata(DocumentMetadataRequired, total=False):
-    """Rich metadata for a document with R2R-compatible fields."""
-
-    # Basic optional fields
-    title: str | None
-    description: str | None
-
-    # Content categorization
-    tags: list[str]
-    category: str
-    section: str
-    language: str
-
-    # Authorship and source info
-    author: str
-    domain: str
-    site_name: str
-
-    # Document structure
-    heading_hierarchy: list[str]
-    section_depth: int
-    has_code_blocks: bool
-    has_images: bool
-    has_links: bool
-
-    # Processing metadata
-    extraction_method: str
-    crawl_depth: int
-    last_modified: datetime | None
-
-    # Content quality indicators
-    readability_score: float | None
-    completeness_score: float | None
-
-    # Repository-specific fields
-    file_path: str | None
-    repository_name: str | None
-    branch_name: str | None
-    commit_hash: str | None
-    programming_language: str | None
-
-    # Custom business metadata
-    importance_score: float | None
-    review_status: str | None
-    assigned_team: str | None
-
-
-class Document(BaseModel):
-    """Represents a single document."""
-
-    id: UUID = Field(default_factory=uuid4)
-    content: str
-    metadata: DocumentMetadata
-    vector: list[float] | None = Field(default=None)
-    score: float | None = Field(default=None)
-    source: IngestionSource
-    collection: str = Field(default="documents")
-
-
-class IngestionJob(BaseModel):
-    """Represents an ingestion job."""
-
-    id: UUID = Field(default_factory=uuid4)
-    source_type: IngestionSource
-    source_url: HttpUrl | str
-    status: IngestionStatus = Field(default=IngestionStatus.PENDING)
-    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
-    updated_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
-    completed_at: datetime | None = Field(default=None)
-    error_message: str | None = Field(default=None)
-    document_count: int = Field(default=0)
-    storage_backend: StorageBackend
-
-
-class IngestionResult(BaseModel):
-    """Result of an ingestion operation."""
-
-    job_id: UUID
-    status: IngestionStatus
-    documents_processed: int
-    documents_failed: int
-    duration_seconds: float
-    error_messages: list[str] = Field(default_factory=list)
-</file>
-
-<file path="ingest_pipeline/flows/ingestion.py">
-"""Prefect flow for ingestion pipeline."""
-
-from __future__ import annotations
-
-from collections.abc import Callable
-from datetime import UTC, datetime
-from typing import TYPE_CHECKING, Literal, TypeAlias, assert_never, cast
-
-from prefect import flow, get_run_logger, task
-from prefect.blocks.core import Block
-from prefect.variables import Variable
-from pydantic.types import SecretStr
-
-from ..config.settings import Settings
-from ..core.exceptions import IngestionError
-from ..core.models import (
-    Document,
-    FirecrawlConfig,
-    IngestionJob,
-    IngestionResult,
-    IngestionSource,
-    IngestionStatus,
-    RepomixConfig,
-    StorageBackend,
-    StorageConfig,
-)
-from ..ingestors import BaseIngestor, FirecrawlIngestor, FirecrawlPage, RepomixIngestor
-from ..storage import OpenWebUIStorage, WeaviateStorage
-from ..storage import R2RStorage as RuntimeR2RStorage
-from ..storage.base import BaseStorage
-from ..utils.metadata_tagger import MetadataTagger
-
-SourceTypeLiteral = Literal["web", "repository", "documentation"]
-StorageBackendLiteral = Literal["weaviate", "open_webui", "r2r"]
-SourceTypeLike: TypeAlias = IngestionSource | SourceTypeLiteral
-StorageBackendLike: TypeAlias = StorageBackend | StorageBackendLiteral
-
-
-def _safe_cache_key(prefix: str, params: dict[str, object], key: str) -> str:
-    """Create a type-safe cache key from task parameters."""
-    value = params.get(key, "")
-    return f"{prefix}_{hash(str(value))}"
-
-
-if TYPE_CHECKING:
-    from ..storage.r2r.storage import R2RStorage as R2RStorageType
-else:
-    R2RStorageType = BaseStorage
-
-
-@task(name="validate_source", retries=2, retry_delay_seconds=10, tags=["validation"])
-async def validate_source_task(source_url: str, source_type: IngestionSource) -> bool:
-    """
-    Validate that a source is accessible.
-
-    Args:
-        source_url: URL or path to source
-        source_type: Type of source
-
-    Returns:
-        True if valid
-    """
-    if source_type == IngestionSource.WEB:
-        ingestor = FirecrawlIngestor()
-    elif source_type == IngestionSource.REPOSITORY:
-        ingestor = RepomixIngestor()
-    else:
-        raise ValueError(f"Unsupported source type: {source_type}")
-
-    result = await ingestor.validate_source(source_url)
-    return bool(result)
-
-
-@task(name="initialize_storage", retries=3, retry_delay_seconds=5, tags=["storage"])
-async def initialize_storage_task(config: StorageConfig | str) -> BaseStorage:
-    """
-    Initialize storage backend.
-
-    Args:
-        config: Storage configuration block or block name
-
-    Returns:
-        Initialized storage adapter
-    """
-    # Load block if string provided
-    if isinstance(config, str):
-        # Use Block.aload with type slug for better type inference
-        loaded_block = await Block.aload(f"storage-config/{config}")
-        config = cast(StorageConfig, loaded_block)
-
-    if config.backend == StorageBackend.WEAVIATE:
-        storage = WeaviateStorage(config)
-    elif config.backend == StorageBackend.OPEN_WEBUI:
-        storage = OpenWebUIStorage(config)
-    elif config.backend == StorageBackend.R2R:
-        if RuntimeR2RStorage is None:
-            raise ValueError("R2R storage not available. Check dependencies.")
-        storage = RuntimeR2RStorage(config)
-    else:
-        raise ValueError(f"Unsupported backend: {config.backend}")
-
-    await storage.initialize()
-    return storage
-
-
-@task(name="map_firecrawl_site", retries=2, retry_delay_seconds=15, tags=["firecrawl", "map"],
-      cache_key_fn=lambda ctx, p: _safe_cache_key("firecrawl_map", p, "source_url"))
-async def map_firecrawl_site_task(source_url: str, config: FirecrawlConfig | str) -> list[str]:
-    """Map a site using Firecrawl and return discovered URLs."""
-    # Load block if string provided
-    if isinstance(config, str):
-        # Use Block.aload with type slug for better type inference
-        loaded_block = await Block.aload(f"firecrawl-config/{config}")
-        config = cast(FirecrawlConfig, loaded_block)
-
-    ingestor = FirecrawlIngestor(config)
-    mapped = await ingestor.map_site(source_url)
-    return mapped or [source_url]
-
-
-@task(name="filter_existing_documents", retries=1, retry_delay_seconds=5, tags=["dedup"],
-      cache_key_fn=lambda ctx, p: _safe_cache_key("filter_docs", p, "urls"))  # Cache based on URL list
-async def filter_existing_documents_task(
-    urls: list[str],
-    storage_client: BaseStorage,
-    stale_after_days: int = 30,
-    *,
-    collection_name: str | None = None,
-) -> list[str]:
-    """Filter URLs to only those that need scraping (missing or stale in storage)."""
-    logger = get_run_logger()
-    eligible: list[str] = []
-
-    for url in urls:
-        document_id = str(FirecrawlIngestor.compute_document_id(url))
-        exists = await storage_client.check_exists(
-            document_id,
-            collection_name=collection_name,
-            stale_after_days=stale_after_days
-        )
-
-        if not exists:
-            eligible.append(url)
-
-    skipped = len(urls) - len(eligible)
-    if skipped > 0:
-        logger.info("Skipping %s up-to-date documents in %s", skipped, storage_client.display_name)
-
-    return eligible
-
-
-@task(
-    name="scrape_firecrawl_batch", retries=2, retry_delay_seconds=20, tags=["firecrawl", "scrape"]
-)
-async def scrape_firecrawl_batch_task(
-    batch_urls: list[str], config: FirecrawlConfig
-) -> list[FirecrawlPage]:
-    """Scrape a batch of URLs via Firecrawl."""
-    ingestor = FirecrawlIngestor(config)
-    result: list[FirecrawlPage] = await ingestor.scrape_pages(batch_urls)
-    return result
-
-
-@task(name="annotate_firecrawl_metadata", retries=1, retry_delay_seconds=10, tags=["metadata"])
-async def annotate_firecrawl_metadata_task(
-    pages: list[FirecrawlPage], job: IngestionJob
-) -> list[Document]:
-    """Annotate scraped pages with standardized metadata."""
-    if not pages:
-        return []
-
-    ingestor = FirecrawlIngestor()
-    documents = [ingestor.create_document(page, job) for page in pages]
-
-    try:
-        from ..config import get_settings
-
-        settings = get_settings()
-        async with MetadataTagger(llm_endpoint=str(settings.llm_endpoint)) as tagger:
-            tagged_documents: list[Document] = await tagger.tag_batch(documents)
-            return tagged_documents
-    except IngestionError as exc:  # pragma: no cover - logging side effect
-        logger = get_run_logger()
-        logger.warning("Metadata tagging failed: %s", exc)
-        return documents
-    except Exception as exc:  # pragma: no cover - defensive
-        logger = get_run_logger()
-        logger.warning("Metadata tagging unavailable, using base metadata: %s", exc)
-        return documents
-
-
-@task(name="upsert_r2r_documents", retries=2, retry_delay_seconds=20, tags=["storage", "r2r"])
-async def upsert_r2r_documents_task(
-    storage_client: R2RStorageType,
-    documents: list[Document],
-    collection_name: str | None,
-) -> tuple[int, int]:
-    """Upsert documents into R2R storage."""
-    if not documents:
-        return 0, 0
-
-    stored_ids: list[str] = await storage_client.store_batch(
-        documents, collection_name=collection_name
-    )
-    processed = len(stored_ids)
-    failed = len(documents) - processed
-
-    if failed:
-        logger = get_run_logger()
-        logger.warning("Failed to upsert %s documents to R2R", failed)
-
-    return processed, failed
-
-
-@task(name="ingest_documents", retries=2, retry_delay_seconds=30, tags=["ingestion"])
-async def ingest_documents_task(
-    job: IngestionJob,
-    collection_name: str | None = None,
-    batch_size: int | None = None,
-    storage_client: BaseStorage | None = None,
-    storage_block_name: str | None = None,
-    ingestor_config_block_name: str | None = None,
-    progress_callback: Callable[[int, str], None] | None = None,
-) -> tuple[int, int]:
-    """
-    Ingest documents from source with optional pre-initialized storage client.
-
-    Args:
-        job: Ingestion job configuration
-        collection_name: Target collection name
-        batch_size: Number of documents per batch (uses Variable if None)
-        storage_client: Optional pre-initialized storage client
-        storage_block_name: Optional storage block name to load
-        ingestor_config_block_name: Optional ingestor config block name to load
-        progress_callback: Optional callback for progress updates
-
-    Returns:
-        Tuple of (processed_count, failed_count)
-    """
-    if progress_callback:
-        progress_callback(35, "Creating ingestor and storage clients...")
-
-    # Use Variable for batch size if not provided
-    if batch_size is None:
-        try:
-            batch_size_var = await Variable.aget("default_batch_size", default="50")
-            # Convert Variable result to int, handling various types
-            if isinstance(batch_size_var, int):
-                batch_size = batch_size_var
-            elif isinstance(batch_size_var, (str, float)):
-                batch_size = int(float(str(batch_size_var)))
-            else:
-                batch_size = 50
-        except Exception:
-            batch_size = 50
-
-    ingestor = await _create_ingestor(job, ingestor_config_block_name)
-    storage = storage_client or await _create_storage(job, collection_name, storage_block_name)
-
-    if progress_callback:
-        progress_callback(40, "Starting document processing...")
-
-    return await _process_documents(ingestor, storage, job, batch_size, collection_name, progress_callback)
-
-
-async def _create_ingestor(job: IngestionJob, config_block_name: str | None = None) -> BaseIngestor:
-    """Create appropriate ingestor based on job source type."""
-    if job.source_type == IngestionSource.WEB:
-        if config_block_name:
-            # Use Block.aload with type slug for better type inference
-            loaded_block = await Block.aload(f"firecrawl-config/{config_block_name}")
-            config = cast(FirecrawlConfig, loaded_block)
-        else:
-            # Fallback to default configuration
-            config = FirecrawlConfig()
-        return FirecrawlIngestor(config)
-    elif job.source_type == IngestionSource.REPOSITORY:
-        if config_block_name:
-            # Use Block.aload with type slug for better type inference
-            loaded_block = await Block.aload(f"repomix-config/{config_block_name}")
-            config = cast(RepomixConfig, loaded_block)
-        else:
-            # Fallback to default configuration
-            config = RepomixConfig()
-        return RepomixIngestor(config)
-    else:
-        raise ValueError(f"Unsupported source: {job.source_type}")
-
-
-async def _create_storage(job: IngestionJob, collection_name: str | None, storage_block_name: str | None = None) -> BaseStorage:
-    """Create and initialize storage client."""
-    if collection_name is None:
-        # Use variable for default collection prefix
-        prefix = await Variable.aget("default_collection_prefix", default="docs")
-        collection_name = f"{prefix}_{job.source_type.value}"
-
-    if storage_block_name:
-        # Load storage config from block
-        loaded_block = await Block.aload(f"storage-config/{storage_block_name}")
-        storage_config = cast(StorageConfig, loaded_block)
-        # Override collection name if provided
-        storage_config.collection_name = collection_name
-    else:
-        # Fallback to building config from settings
-        from ..config import get_settings
-        settings = get_settings()
-        storage_config = _build_storage_config(job, settings, collection_name)
-
-    storage = _instantiate_storage(job.storage_backend, storage_config)
-    await storage.initialize()
-    return storage
-
-
-def _build_storage_config(
-    job: IngestionJob, settings: Settings, collection_name: str
-) -> StorageConfig:
-    """Build storage configuration from job and settings."""
-    storage_endpoints = {
-        StorageBackend.WEAVIATE: settings.weaviate_endpoint,
-        StorageBackend.OPEN_WEBUI: settings.openwebui_endpoint,
-        StorageBackend.R2R: settings.get_storage_endpoint("r2r"),
-    }
-    storage_api_keys: dict[StorageBackend, str | None] = {
-        StorageBackend.WEAVIATE: settings.get_api_key("weaviate"),
-        StorageBackend.OPEN_WEBUI: settings.get_api_key("openwebui"),
-        StorageBackend.R2R: None,  # R2R is self-hosted, no API key needed
-    }
-
-    api_key_raw: str | None = storage_api_keys[job.storage_backend]
-    api_key: SecretStr | None = SecretStr(api_key_raw) if api_key_raw is not None else None
-
-    return StorageConfig(
-        backend=job.storage_backend,
-        endpoint=storage_endpoints[job.storage_backend],
-        api_key=api_key,
-        collection_name=collection_name,
-    )
-
-
-def _instantiate_storage(backend: StorageBackend, config: StorageConfig) -> BaseStorage:
-    """Instantiate storage based on backend type."""
-    if backend == StorageBackend.WEAVIATE:
-        return WeaviateStorage(config)
-    elif backend == StorageBackend.OPEN_WEBUI:
-        return OpenWebUIStorage(config)
-    elif backend == StorageBackend.R2R:
-        if RuntimeR2RStorage is None:
-            raise ValueError("R2R storage not available. Check dependencies.")
-        return RuntimeR2RStorage(config)
-
-    assert_never(backend)
-
-
-def _chunk_urls(urls: list[str], chunk_size: int) -> list[list[str]]:
-    """Group URLs into fixed-size chunks for batch processing."""
-
-    if chunk_size <= 0:
-        raise ValueError("chunk_size must be greater than zero")
-
-    return [urls[i : i + chunk_size] for i in range(0, len(urls), chunk_size)]
-
-
-def _deduplicate_urls(urls: list[str]) -> list[str]:
-    """Return the URLs with order preserved and duplicates removed."""
-
-    seen: set[str] = set()
-    unique: list[str] = []
-    for url in urls:
-        if url not in seen:
-            seen.add(url)
-            unique.append(url)
-    return unique
-
-
-async def _process_documents(
-    ingestor: BaseIngestor,
-    storage: BaseStorage,
-    job: IngestionJob,
-    batch_size: int,
-    collection_name: str | None,
-    progress_callback: Callable[[int, str], None] | None = None,
-) -> tuple[int, int]:
-    """Process documents in batches."""
-    processed = 0
-    failed = 0
-    batch: list[Document] = []
-    total_documents = 0
-    batch_count = 0
-
-    if progress_callback:
-        progress_callback(45, "Ingesting documents from source...")
-
-    # Use smart ingestion with deduplication if storage supports it
-    if hasattr(storage, 'check_exists'):
-        try:
-            # Try to use the smart ingestion method
-            document_generator = ingestor.ingest_with_dedup(
-                job, storage, collection_name=collection_name
-            )
-        except Exception:
-            # Fall back to regular ingestion if smart method fails
-            document_generator = ingestor.ingest(job)
-    else:
-        document_generator = ingestor.ingest(job)
-
-    async for document in document_generator:
-        batch.append(document)
-        total_documents += 1
-
-        if len(batch) >= batch_size:
-            batch_count += 1
-            if progress_callback:
-                progress_callback(
-                    45 + min(35, (batch_count * 10)),
-                    f"Processing batch {batch_count} ({total_documents} documents so far)..."
-                )
-
-            batch_processed, batch_failed = await _store_batch(storage, batch, collection_name)
-            processed += batch_processed
-            failed += batch_failed
-            batch = []
-
-    # Process remaining batch
-    if batch:
-        batch_count += 1
-        if progress_callback:
-            progress_callback(80, f"Processing final batch ({total_documents} total documents)...")
-
-        batch_processed, batch_failed = await _store_batch(storage, batch, collection_name)
-        processed += batch_processed
-        failed += batch_failed
-
-    if progress_callback:
-        progress_callback(85, f"Completed processing {total_documents} documents")
-
-    return processed, failed
-
-
-async def _store_batch(
-    storage: BaseStorage,
-    batch: list[Document],
-    collection_name: str | None,
-) -> tuple[int, int]:
-    """Store a batch of documents and return processed/failed counts."""
-    try:
-        # Apply metadata tagging for backends that benefit from it
-        processed_batch = batch
-        if hasattr(storage, "config") and storage.config.backend in (
-            StorageBackend.R2R,
-            StorageBackend.WEAVIATE,
-        ):
-            try:
-                from ..config import get_settings
-
-                settings = get_settings()
-                async with MetadataTagger(llm_endpoint=str(settings.llm_endpoint)) as tagger:
-                    processed_batch = await tagger.tag_batch(batch)
-            except Exception as exc:
-                print(f"Metadata tagging failed, using original documents: {exc}")
-                processed_batch = batch
-
-        stored_ids = await storage.store_batch(processed_batch, collection_name=collection_name)
-        processed_count = len(stored_ids)
-        failed_count = len(processed_batch) - processed_count
-
-        batch_type = (
-            "final" if len(processed_batch) < 50 else ""
-        )  # Assume standard batch size is 50
-        print(f"Successfully stored {processed_count} documents in {batch_type} batch".strip())
-
-        return processed_count, failed_count
-    except Exception as e:
-        batch_type = "Final" if len(batch) < 50 else "Batch"
-        print(f"{batch_type} storage failed: {e}")
-        return 0, len(batch)
-
-
-@flow(
-    name="firecrawl_to_r2r",
-    description="Ingest Firecrawl pages into R2R with metadata annotation",
-    persist_result=False,
-    log_prints=True,
-)
-async def firecrawl_to_r2r_flow(
-    job: IngestionJob, collection_name: str | None = None, progress_callback: Callable[[int, str], None] | None = None
-) -> tuple[int, int]:
-    """Specialized flow for Firecrawl ingestion into R2R."""
-    logger = get_run_logger()
-    from ..config import get_settings
-
-    if progress_callback:
-        progress_callback(35, "Initializing Firecrawl and R2R storage...")
-
-    settings = get_settings()
-    firecrawl_config = FirecrawlConfig()
-    resolved_collection = collection_name or f"docs_{job.source_type.value}"
-
-    storage_config = _build_storage_config(job, settings, resolved_collection)
-    storage_client = await initialize_storage_task(storage_config)
-
-    if RuntimeR2RStorage is None or not isinstance(storage_client, RuntimeR2RStorage):
-        raise IngestionError("Firecrawl to R2R flow requires an R2R storage backend")
-
-    r2r_storage = cast("R2RStorageType", storage_client)
-
-    if progress_callback:
-        progress_callback(45, "Checking for existing content before mapping...")
-
-    # Smart mapping: try single URL first to avoid expensive map operation
-    base_url = str(job.source_url)
-    single_url_id = str(FirecrawlIngestor.compute_document_id(base_url))
-    base_exists = await r2r_storage.check_exists(
-        single_url_id, collection_name=resolved_collection, stale_after_days=30
-    )
-
-    if base_exists:
-        # Check if this is a recent single-page update
-        logger.info("Base URL %s exists and is fresh, skipping expensive mapping", base_url)
-        if progress_callback:
-            progress_callback(100, "Content is up to date, no processing needed")
-        return 0, 0
-
-    if progress_callback:
-        progress_callback(50, "Discovering pages with Firecrawl...")
-
-    discovered_urls = await map_firecrawl_site_task(base_url, firecrawl_config)
-    unique_urls = _deduplicate_urls(discovered_urls)
-    logger.info("Discovered %s unique URLs from Firecrawl map", len(unique_urls))
-
-    if progress_callback:
-        progress_callback(60, f"Found {len(unique_urls)} pages, filtering existing content...")
-
-    eligible_urls = await filter_existing_documents_task(
-        unique_urls, r2r_storage, collection_name=resolved_collection
-    )
-
-    if not eligible_urls:
-        logger.info("All Firecrawl pages are up to date for %s", job.source_url)
-        if progress_callback:
-            progress_callback(100, "All pages are up to date, no processing needed")
-        return 0, 0
-
-    if progress_callback:
-        progress_callback(70, f"Scraping {len(eligible_urls)} new/updated pages...")
-
-    batch_size = min(settings.default_batch_size, firecrawl_config.limit)
-    url_batches = _chunk_urls(eligible_urls, batch_size)
-    logger.info("Scraping %s batches of Firecrawl pages", len(url_batches))
-
-    # Use asyncio.gather for concurrent scraping
-    import asyncio
-    scrape_tasks = [
-        scrape_firecrawl_batch_task(batch, firecrawl_config)
-        for batch in url_batches
-    ]
-    batch_results = await asyncio.gather(*scrape_tasks)
-
-    scraped_pages: list[FirecrawlPage] = []
-    for batch_pages in batch_results:
-        scraped_pages.extend(batch_pages)
-
-    if progress_callback:
-        progress_callback(80, f"Processing {len(scraped_pages)} scraped pages...")
-
-    documents = await annotate_firecrawl_metadata_task(scraped_pages, job)
-
-    if not documents:
-        logger.warning("No documents produced after scraping for %s", job.source_url)
-        return 0, len(eligible_urls)
-
-    if progress_callback:
-        progress_callback(90, f"Storing {len(documents)} documents in R2R...")
-
-    processed, failed = await upsert_r2r_documents_task(r2r_storage, documents, resolved_collection)
-
-    logger.info("Upserted %s documents into R2R (%s failed)", processed, failed)
-
-    return processed, failed
-
-
-@task(name="update_job_status", tags=["tracking"])
-async def update_job_status_task(
-    job: IngestionJob,
-    status: IngestionStatus,
-    processed: int = 0,
-    _failed: int = 0,
-    error: str | None = None,
-) -> IngestionJob:
-    """
-    Update job status.
-
-    Args:
-        job: Ingestion job
-        status: New status
-        processed: Documents processed
-        _failed: Documents failed (currently unused)
-        error: Error message if any
-
-    Returns:
-        Updated job
-    """
-    job.status = status
-    job.updated_at = datetime.now(UTC)
-    job.document_count = processed
-
-    if status == IngestionStatus.COMPLETED:
-        job.completed_at = datetime.now(UTC)
-
-    if error:
-        job.error_message = error
-
-    return job
-
-
-@flow(
-    name="ingestion_pipeline",
-    description="Main ingestion pipeline for documents",
-    retries=1,
-    retry_delay_seconds=60,
-    persist_result=True,
-    log_prints=True,
-)
-async def create_ingestion_flow(
-    source_url: str,
-    source_type: SourceTypeLike,
-    storage_backend: StorageBackendLike = StorageBackend.WEAVIATE,
-    collection_name: str | None = None,
-    validate_first: bool = True,
-    progress_callback: Callable[[int, str], None] | None = None,
-) -> IngestionResult:
-    """
-    Main ingestion flow.
-
-    Args:
-        source_url: URL or path to source
-        source_type: Type of source
-        storage_backend: Storage backend to use
-        validate_first: Whether to validate source first
-        progress_callback: Optional callback for progress updates
-
-    Returns:
-        Ingestion result
-    """
-    print(f"Starting ingestion from {source_url}")
-
-    source_enum = IngestionSource(source_type)
-    backend_enum = StorageBackend(storage_backend)
-
-    # Create job
-    job = IngestionJob(
-        source_url=source_url,
-        source_type=source_enum,
-        storage_backend=backend_enum,
-        status=IngestionStatus.PENDING,
-    )
-
-    start_time = datetime.now(UTC)
-    error_messages: list[str] = []
-    processed = 0
-    failed = 0
-
-    try:
-        # Validate source if requested
-        if validate_first:
-            if progress_callback:
-                progress_callback(10, "Validating source...")
-            print("Validating source...")
-            is_valid = await validate_source_task(source_url, job.source_type)
-
-            if not is_valid:
-                raise IngestionError(f"Source validation failed: {source_url}")
-
-        # Update status to in progress
-        if progress_callback:
-            progress_callback(20, "Initializing storage...")
-        job = await update_job_status_task(job, IngestionStatus.IN_PROGRESS)
-
-        # Run ingestion
-        if progress_callback:
-            progress_callback(30, "Starting document ingestion...")
-        print("Ingesting documents...")
-        if job.source_type == IngestionSource.WEB and job.storage_backend == StorageBackend.R2R:
-            processed, failed = await firecrawl_to_r2r_flow(job, collection_name, progress_callback=progress_callback)
-        else:
-            processed, failed = await ingest_documents_task(job, collection_name, progress_callback=progress_callback)
-
-        if progress_callback:
-            progress_callback(90, "Finalizing ingestion...")
-
-        # Update final status
-        if failed > 0:
-            error_messages.append(f"{failed} documents failed to process")
-
-        # Set status based on results
-        if processed == 0 and failed > 0:
-            final_status = IngestionStatus.FAILED
-        elif failed > 0:
-            final_status = IngestionStatus.PARTIAL
-        else:
-            final_status = IngestionStatus.COMPLETED
-
-        job = await update_job_status_task(job, final_status, processed=processed, _failed=failed)
-
-        print(f"Ingestion completed: {processed} processed, {failed} failed")
-
-    except Exception as e:
-        print(f"Ingestion failed: {e}")
-        error_messages.append(str(e))
-
-        # Don't reset counts - keep whatever was processed before the error
-        job = await update_job_status_task(
-            job, IngestionStatus.FAILED, processed=processed, _failed=failed, error=str(e)
-        )
-
-    # Calculate duration
-    duration = (datetime.now(UTC) - start_time).total_seconds()
-
-    return IngestionResult(
-        job_id=job.id,
-        status=job.status,
-        documents_processed=processed,
-        documents_failed=failed,
-        duration_seconds=duration,
-        error_messages=error_messages,
-    )
-</file>
-
 <file path="ingest_pipeline/flows/scheduler.py">
 """Scheduler for Prefect deployments."""
 
@@ -11539,1949 +8567,6 @@ class FirecrawlIngestor(BaseIngestor):
         await self.close()
 </file>
 
-<file path="ingest_pipeline/storage/base.py">
-"""Base storage interface."""
-
-from abc import ABC, abstractmethod
-from collections.abc import AsyncGenerator
-
-from ..core.models import Document, StorageConfig
-
-
-class BaseStorage(ABC):
-    """Abstract base class for storage adapters."""
-
-    config: StorageConfig
-
-    def __init__(self, config: StorageConfig):
-        """
-        Initialize storage adapter.
-
-        Args:
-            config: Storage configuration
-        """
-        self.config = config
-
-    @property
-    def display_name(self) -> str:
-        """Human-readable name for UI display."""
-        return self.__class__.__name__.replace("Storage", "")
-
-    @abstractmethod
-    async def initialize(self) -> None:
-        """Initialize the storage backend and create collections if needed."""
-        pass  # pragma: no cover
-
-    @abstractmethod
-    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
-        """
-        Store a single document.
-
-        Args:
-            document: Document to store
-
-        Returns:
-            Document ID
-        """
-        pass  # pragma: no cover
-
-    @abstractmethod
-    async def store_batch(
-        self, documents: list[Document], *, collection_name: str | None = None
-    ) -> list[str]:
-        """
-        Store multiple documents in batch.
-
-        Args:
-            documents: List of documents to store
-
-        Returns:
-            List of document IDs
-        """
-        pass  # pragma: no cover
-
-    async def retrieve(
-        self, document_id: str, *, collection_name: str | None = None
-    ) -> Document | None:
-        """
-        Retrieve a document by ID (if supported by backend).
-
-        Args:
-            document_id: Document ID
-
-        Returns:
-            Document or None if not found
-
-        Raises:
-            NotImplementedError: If backend doesn't support retrieval
-        """
-        raise NotImplementedError(f"{self.__class__.__name__} doesn't support document retrieval")
-
-    async def check_exists(
-        self, document_id: str, *, collection_name: str | None = None, stale_after_days: int = 30
-    ) -> bool:
-        """
-        Check if a document exists and is not stale.
-
-        Args:
-            document_id: Document ID to check
-            collection_name: Collection to check in
-            stale_after_days: Consider document stale after this many days
-
-        Returns:
-            True if document exists and is not stale, False otherwise
-        """
-        try:
-            document = await self.retrieve(document_id, collection_name=collection_name)
-            if document is None:
-                return False
-
-            # Check staleness if timestamp is available
-            if "timestamp" in document.metadata:
-                from datetime import UTC, datetime, timedelta
-                timestamp_obj = document.metadata["timestamp"]
-                if isinstance(timestamp_obj, datetime):
-                    timestamp = timestamp_obj
-                    cutoff = datetime.now(UTC) - timedelta(days=stale_after_days)
-                    return timestamp >= cutoff
-
-            # If no timestamp, assume it exists and is valid
-            return True
-        except Exception:
-            # Backend doesn't support retrieval, assume doesn't exist
-            return False
-
-    def search(
-        self,
-        query: str,
-        limit: int = 10,
-        threshold: float = 0.7,
-        *,
-        collection_name: str | None = None,
-    ) -> AsyncGenerator[Document, None]:
-        """
-        Search for documents (if supported by backend).
-
-        Args:
-            query: Search query
-            limit: Maximum number of results
-            threshold: Similarity threshold
-
-        Yields:
-            Matching documents
-
-        Raises:
-            NotImplementedError: If backend doesn't support search
-        """
-        raise NotImplementedError(f"{self.__class__.__name__} doesn't support search")
-
-    @abstractmethod
-    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
-        """
-        Delete a document.
-
-        Args:
-            document_id: Document ID
-
-        Returns:
-            True if deleted successfully
-        """
-        pass  # pragma: no cover
-
-    async def count(self, *, collection_name: str | None = None) -> int:
-        """
-        Get total document count (if supported by backend).
-
-        Returns:
-            Number of documents, 0 if not supported
-        """
-        return 0
-
-    async def list_collections(self) -> list[str]:
-        """
-        List available collections (if supported by backend).
-
-        Returns:
-            List of collection names, empty list if not supported
-        """
-        return []
-
-    async def describe_collections(self) -> list[dict[str, object]]:
-        """
-        Describe available collections with metadata (if supported by backend).
-
-        Returns:
-            List of collection metadata dictionaries, empty list if not supported
-        """
-        return []
-
-    async def list_documents(
-        self,
-        limit: int = 100,
-        offset: int = 0,
-        *,
-        collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
-        """
-        List documents in the storage backend (if supported).
-
-        Args:
-            limit: Maximum number of documents to return
-            offset: Number of documents to skip
-            collection_name: Collection to list documents from
-
-        Returns:
-            List of document dictionaries with metadata
-
-        Raises:
-            NotImplementedError: If backend doesn't support document listing
-        """
-        raise NotImplementedError(f"{self.__class__.__name__} doesn't support document listing")
-
-    async def close(self) -> None:
-        """
-        Close storage connections and cleanup resources.
-
-        Default implementation does nothing.
-        """
-        # Default implementation - storage backends can override to cleanup connections
-        return None
-</file>
-
-<file path="ingest_pipeline/storage/openwebui.py">
-"""Open WebUI storage adapter."""
-
-import asyncio
-import logging
-from typing import Final, TypedDict, cast
-
-import httpx
-from typing_extensions import override
-
-from ..core.exceptions import StorageError
-from ..core.models import Document, StorageConfig
-from .base import BaseStorage
-
-LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
-
-
-class OpenWebUIStorage(BaseStorage):
-    """Storage adapter for Open WebUI knowledge endpoints."""
-
-    client: httpx.AsyncClient
-    _knowledge_cache: dict[str, str]
-
-    def __init__(self, config: StorageConfig):
-        """
-        Initialize Open WebUI storage.
-
-        Args:
-            config: Storage configuration
-        """
-        super().__init__(config)
-
-        headers: dict[str, str] = {}
-        if config.api_key:
-            headers["Authorization"] = f"Bearer {config.api_key}"
-
-        self.client = httpx.AsyncClient(
-            base_url=str(config.endpoint),
-            headers=headers,
-            timeout=30.0,
-        )
-        self._knowledge_cache = {}
-
-    @override
-    async def initialize(self) -> None:
-        """Initialize Open WebUI connection."""
-        try:
-            if self.config.collection_name:
-                await self._get_knowledge_id(
-                    self.config.collection_name,
-                    create=True,
-                )
-
-        except httpx.ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except httpx.HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except httpx.RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to initialize Open WebUI: {e}") from e
-
-    async def _create_collection(self, name: str) -> str:
-        """Create knowledge base in Open WebUI."""
-        try:
-            response = await self.client.post(
-                "/api/v1/knowledge/create",
-                json={
-                    "name": name,
-                    "description": "Documents ingested from various sources",
-                    "data": {},
-                    "access_control": None,
-                },
-            )
-            response.raise_for_status()
-            result = response.json()
-            knowledge_id = result.get("id")
-
-            if not knowledge_id or not isinstance(knowledge_id, str):
-                raise StorageError("Knowledge base creation failed: no ID returned")
-
-            return str(knowledge_id)
-
-        except httpx.ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed during creation: {e}") from e
-        except httpx.HTTPStatusError as e:
-            raise StorageError(
-                f"OpenWebUI returned error {e.response.status_code} during creation: {e}"
-            ) from e
-        except httpx.RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed during creation: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to create knowledge base: {e}") from e
-
-    async def _fetch_knowledge_bases(self) -> list[dict[str, object]]:
-        """Return the list of knowledge bases from the API."""
-        response = await self.client.get("/api/v1/knowledge/list")
-        response.raise_for_status()
-        data = response.json()
-        if not isinstance(data, list):
-            return []
-        normalized: list[dict[str, object]] = []
-        for item in data:
-            if isinstance(item, dict):
-                item_dict: dict[str, object] = item
-                normalized.append({str(k): v for k, v in item_dict.items()})
-        return normalized
-
-    async def _get_knowledge_id(
-        self,
-        name: str | None,
-        *,
-        create: bool,
-    ) -> str | None:
-        """Retrieve (and optionally create) a knowledge base identifier."""
-        target_raw = name or self.config.collection_name
-        target = str(target_raw) if target_raw else ""
-        if not target:
-            raise StorageError("Knowledge base name is required")
-
-        if cached := self._knowledge_cache.get(target):
-            return cached
-
-        knowledge_bases = await self._fetch_knowledge_bases()
-        for kb in knowledge_bases:
-            if kb.get("name") == target:
-                kb_id = kb.get("id")
-                if isinstance(kb_id, str):
-                    self._knowledge_cache[target] = kb_id
-                    return kb_id
-
-        if not create:
-            return None
-
-        knowledge_id = await self._create_collection(target)
-        self._knowledge_cache[target] = knowledge_id
-        return knowledge_id
-
-    @override
-    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
-        """
-        Store a document in Open WebUI as a file.
-
-        Args:
-            document: Document to store
-
-        Returns:
-            File ID
-        """
-        try:
-            knowledge_id = await self._get_knowledge_id(
-                collection_name,
-                create=True,
-            )
-            if not knowledge_id:
-                raise StorageError("Knowledge base not initialized")
-
-            # Step 1: Upload document as file
-            # Use document title from metadata if available, otherwise fall back to ID
-            filename = document.metadata.get("title") or f"doc_{document.id}"
-            # Ensure filename has proper extension
-            if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
-                filename = f"{filename}.txt"
-            files = {"file": (filename, document.content.encode(), "text/plain")}
-            response = await self.client.post(
-                "/api/v1/files/",
-                files=files,
-                params={"process": True, "process_in_background": False},
-            )
-            response.raise_for_status()
-
-            file_data = response.json()
-            file_id = file_data.get("id")
-
-            if not file_id or not isinstance(file_id, str):
-                raise StorageError("File upload failed: no file ID returned")
-
-            # Step 2: Add file to knowledge base
-            response = await self.client.post(
-                f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
-            )
-            response.raise_for_status()
-
-            return str(file_id)
-
-        except httpx.ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except httpx.HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except httpx.RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to store document: {e}") from e
-
-    @override
-    async def store_batch(
-        self, documents: list[Document], *, collection_name: str | None = None
-    ) -> list[str]:
-        """
-        Store multiple documents as files in batch.
-
-        Args:
-            documents: List of documents
-
-        Returns:
-            List of file IDs
-        """
-        try:
-            knowledge_id = await self._get_knowledge_id(
-                collection_name,
-                create=True,
-            )
-            if not knowledge_id:
-                raise StorageError("Knowledge base not initialized")
-
-            async def upload_and_attach(doc: Document) -> str:
-                # Use document title from metadata if available, otherwise fall back to ID
-                filename = doc.metadata.get("title") or f"doc_{doc.id}"
-                # Ensure filename has proper extension
-                if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
-                    filename = f"{filename}.txt"
-                files = {"file": (filename, doc.content.encode(), "text/plain")}
-                upload_response = await self.client.post(
-                    "/api/v1/files/",
-                    files=files,
-                    params={"process": True, "process_in_background": False},
-                )
-                upload_response.raise_for_status()
-
-                file_data = upload_response.json()
-                file_id = file_data.get("id")
-
-                if not file_id or not isinstance(file_id, str):
-                    raise StorageError(
-                        f"File upload failed for document {doc.id}: no file ID returned"
-                    )
-
-                attach_response = await self.client.post(
-                    f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
-                )
-                attach_response.raise_for_status()
-
-                return str(file_id)
-
-            tasks = [upload_and_attach(doc) for doc in documents]
-            results = await asyncio.gather(*tasks, return_exceptions=True)
-
-            file_ids: list[str] = []
-            failures: list[str] = []
-
-            for index, result in enumerate(results):
-                doc = documents[index]
-                if isinstance(result, Exception):
-                    failures.append(f"{doc.id}: {result}")
-                else:
-                    file_ids.append(cast(str, result))
-
-            if failures:
-                LOGGER.warning(
-                    "OpenWebUI partial batch failure for knowledge base %s: %s",
-                    self.config.collection_name,
-                    ", ".join(failures),
-                )
-
-            return file_ids
-
-        except httpx.ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed during batch: {e}") from e
-        except httpx.HTTPStatusError as e:
-            raise StorageError(
-                f"OpenWebUI returned error {e.response.status_code} during batch: {e}"
-            ) from e
-        except httpx.RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed during batch: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to store batch: {e}") from e
-
-    @override
-    async def retrieve(
-        self, document_id: str, *, collection_name: str | None = None
-    ) -> Document | None:
-        """
-        OpenWebUI doesn't support document retrieval by ID.
-
-        Args:
-            document_id: File ID (not supported)
-            collection_name: Collection name (not used)
-
-        Returns:
-            Always None - retrieval not supported
-        """
-        # OpenWebUI uses file-based storage without direct document retrieval
-        # This will cause the base check_exists method to return False,
-        # which means documents will always be re-scraped for OpenWebUI
-        raise NotImplementedError("OpenWebUI doesn't support document retrieval by ID")
-
-    @override
-    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
-        """
-        Remove a file from Open WebUI knowledge base.
-
-        Args:
-            document_id: File ID to remove
-
-        Returns:
-            True if removed successfully
-        """
-        try:
-            knowledge_id = await self._get_knowledge_id(
-                collection_name,
-                create=False,
-            )
-            if not knowledge_id:
-                return False
-
-            # Remove file from knowledge base
-            response = await self.client.post(
-                f"/api/v1/knowledge/{knowledge_id}/file/remove", json={"file_id": document_id}
-            )
-            response.raise_for_status()
-
-            delete_response = await self.client.delete(f"/api/v1/files/{document_id}")
-            if delete_response.status_code == 404:
-                return True
-            delete_response.raise_for_status()
-            return True
-
-        except httpx.ConnectError as exc:
-            LOGGER.error(
-                "Failed to reach OpenWebUI when deleting file %s", document_id, exc_info=exc
-            )
-            return False
-        except httpx.HTTPStatusError as exc:
-            LOGGER.error(
-                "OpenWebUI returned status error %s when deleting file %s",
-                exc.response.status_code if exc.response else "unknown",
-                document_id,
-                exc_info=exc,
-            )
-            return False
-        except httpx.RequestError as exc:
-            LOGGER.error("Request error deleting file %s from OpenWebUI", document_id, exc_info=exc)
-            return False
-        except Exception as exc:
-            LOGGER.error("Unexpected error deleting file %s", document_id, exc_info=exc)
-            return False
-
-    async def list_collections(self) -> list[str]:
-        """
-        List all available knowledge bases.
-
-        Returns:
-            List of knowledge base names
-        """
-        try:
-            knowledge_bases = await self._fetch_knowledge_bases()
-
-            # Extract names from knowledge bases
-            return [
-                str(kb.get("name", f"knowledge_{kb.get('id', 'unknown')}") or "")
-                for kb in knowledge_bases
-            ]
-
-        except httpx.ConnectError as e:
-            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
-        except httpx.HTTPStatusError as e:
-            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
-        except httpx.RequestError as e:
-            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to list knowledge bases: {e}") from e
-
-    async def delete_collection(self, collection_name: str) -> bool:
-        """
-        Delete a knowledge base by name.
-
-        Args:
-            collection_name: Name of the knowledge base to delete
-
-        Returns:
-            True if deleted successfully, False otherwise
-        """
-        try:
-            knowledge_id = await self._get_knowledge_id(collection_name, create=False)
-            if not knowledge_id:
-                # Collection doesn't exist, consider it already deleted
-                return True
-
-            # Delete the knowledge base using the OpenWebUI API
-            response = await self.client.delete(f"/api/v1/knowledge/{knowledge_id}/delete")
-            response.raise_for_status()
-
-            # Remove from cache if it exists
-            if collection_name in self._knowledge_cache:
-                del self._knowledge_cache[collection_name]
-
-            LOGGER.info("Successfully deleted knowledge base: %s", collection_name)
-            return True
-
-        except httpx.HTTPStatusError as e:
-            # Handle 404 as success (already deleted)
-            if e.response.status_code == 404:
-                LOGGER.info("Knowledge base %s was already deleted or not found", collection_name)
-                return True
-            LOGGER.error(
-                "OpenWebUI returned error %s when deleting knowledge base %s",
-                e.response.status_code,
-                collection_name,
-                exc_info=e,
-            )
-            return False
-        except httpx.ConnectError as e:
-            LOGGER.error(
-                "Failed to reach OpenWebUI when deleting knowledge base %s",
-                collection_name,
-                exc_info=e,
-            )
-            return False
-        except httpx.RequestError as e:
-            LOGGER.error(
-                "Request error deleting knowledge base %s from OpenWebUI",
-                collection_name,
-                exc_info=e,
-            )
-            return False
-        except Exception as e:
-            LOGGER.error("Unexpected error deleting knowledge base %s", collection_name, exc_info=e)
-            return False
-
-    class CollectionSummary(TypedDict):
-        """Structure describing a knowledge base summary."""
-
-        name: str
-        count: int
-        size_mb: float
-
-
-    async def _get_knowledge_base_count(self, kb: dict[str, object]) -> int:
-        """Get the file count for a knowledge base."""
-        kb_id = kb.get("id")
-        name = kb.get("name", "Unknown")
-
-        if not kb_id:
-            return self._count_files_from_basic_info(kb)
-
-        return await self._count_files_from_detailed_info(str(kb_id), str(name), kb)
-
-    def _count_files_from_basic_info(self, kb: dict[str, object]) -> int:
-        """Count files from basic knowledge base info."""
-        files = kb.get("files", [])
-        return len(files) if isinstance(files, list) and files is not None else 0
-
-    async def _count_files_from_detailed_info(self, kb_id: str, name: str, kb: dict[str, object]) -> int:
-        """Count files by fetching detailed knowledge base info."""
-        try:
-            LOGGER.debug(f"Fetching detailed info for KB '{name}' from /api/v1/knowledge/{kb_id}")
-            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
-            detail_response.raise_for_status()
-            detailed_kb = detail_response.json()
-
-            files = detailed_kb.get("files", [])
-            count = len(files) if isinstance(files, list) and files is not None else 0
-
-            LOGGER.info(f"Knowledge base '{name}' (ID: {kb_id}): found {count} files")
-            return count
-
-        except Exception as e:
-            LOGGER.warning(f"Failed to get detailed info for KB '{name}' (ID: {kb_id}): {e}")
-            return self._count_files_from_basic_info(kb)
-
-    async def describe_collections(self) -> list[dict[str, object]]:
-        """Return metadata about each knowledge base."""
-        try:
-            knowledge_bases = await self._fetch_knowledge_bases()
-            collections: list[dict[str, object]] = []
-
-            for kb in knowledge_bases:
-                if not isinstance(kb, dict):
-                    continue
-
-                count = await self._get_knowledge_base_count(kb)
-                name = kb.get("name", "Unknown")
-                size_mb = count * 0.5  # rough heuristic
-
-                summary: dict[str, object] = {
-                    "name": str(name),
-                    "count": count,
-                    "size_mb": float(size_mb),
-                }
-                collections.append(summary)
-
-            return collections
-
-        except Exception as e:
-            raise StorageError(f"Failed to describe knowledge bases: {e}") from e
-
-    async def count(self, *, collection_name: str | None = None) -> int:
-        """
-        Get document count for a specific collection (knowledge base).
-
-        Args:
-            collection_name: Name of the knowledge base to count documents for
-
-        Returns:
-            Number of documents in the collection, 0 if collection not found
-        """
-        if not collection_name:
-            # If no collection name provided, return total across all collections
-            try:
-                collections = await self.describe_collections()
-                return sum(
-                    int(collection["count"]) if isinstance(collection["count"], (int, str)) else 0
-                    for collection in collections
-                )
-            except Exception:
-                return 0
-
-        try:
-            # Get knowledge base by name and return its file count
-            kb = await self.get_knowledge_by_name(collection_name)
-            if not kb:
-                return 0
-
-            kb_id = kb.get("id")
-            if not kb_id:
-                return 0
-
-            # Get detailed knowledge base information to get accurate file count
-            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
-            detail_response.raise_for_status()
-            detailed_kb = detail_response.json()
-
-            files = detailed_kb.get("files", [])
-            count = len(files) if isinstance(files, list) else 0
-
-            LOGGER.debug(f"Count for collection '{collection_name}': {count} files")
-            return count
-
-        except Exception as e:
-            LOGGER.warning(f"Failed to get count for collection '{collection_name}': {e}")
-            return 0
-
-    async def get_knowledge_by_name(self, name: str) -> dict[str, object] | None:
-        """
-        Get knowledge base details by name.
-
-        Args:
-            name: Knowledge base name
-
-        Returns:
-            Knowledge base details or None if not found
-        """
-        try:
-            response = await self.client.get("/api/v1/knowledge/list")
-            response.raise_for_status()
-            knowledge_bases = response.json()
-
-            return next(
-                (
-                    {str(k): v for k, v in kb.items()}
-                    for kb in knowledge_bases
-                    if isinstance(kb, dict) and kb.get("name") == name
-                ),
-                None,
-            )
-        except Exception as e:
-            raise StorageError(f"Failed to get knowledge base by name: {e}") from e
-
-    async def __aenter__(self) -> "OpenWebUIStorage":
-        """Async context manager entry."""
-        await self.initialize()
-        return self
-
-    async def __aexit__(
-        self,
-        exc_type: type[BaseException] | None,
-        exc_val: BaseException | None,
-        exc_tb: object | None,
-    ) -> None:
-        """Async context manager exit."""
-        await self.close()
-
-    async def list_documents(
-        self,
-        limit: int = 100,
-        offset: int = 0,
-        *,
-        collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
-        """
-        List documents (files) in a knowledge base.
-
-        NOTE: This is a basic implementation that attempts to extract file information
-        from OpenWebUI knowledge bases. The actual file listing capabilities depend
-        on the OpenWebUI API version and may not include detailed file metadata.
-
-        Args:
-            limit: Maximum number of documents to return
-            offset: Number of documents to skip
-            collection_name: Knowledge base name
-
-        Returns:
-            List of document dictionaries with available metadata
-        """
-        try:
-            # Use the knowledge base name or fall back to default
-            kb_name = collection_name or self.config.collection_name or "default"
-
-            # Try to get knowledge base details
-            knowledge_base = await self.get_knowledge_by_name(kb_name)
-            if not knowledge_base:
-                # If specific KB not found, return empty list with a note
-                return []
-
-            # Extract files if available (API structure may vary)
-            files = knowledge_base.get("files", [])
-
-            # Handle different possible API response structures
-            if not isinstance(files, list):
-                # Some API versions might structure this differently
-                # Try to handle gracefully
-                return [
-                    {
-                        "id": "unknown",
-                        "title": f"Knowledge Base: {kb_name}",
-                        "source_url": "",
-                        "description": "OpenWebUI knowledge base (file details not available)",
-                        "content_type": "text/plain",
-                        "content_preview": "Document listing not fully supported for OpenWebUI",
-                        "word_count": 0,
-                        "timestamp": "",
-                    }
-                ]
-
-            # Apply pagination
-            paginated_files = files[offset : offset + limit]
-
-            # Convert to document format with safe field access
-            documents: list[dict[str, object]] = []
-            for i, file_info in enumerate(paginated_files):
-                if not isinstance(file_info, dict):
-                    continue
-
-                # Safely extract fields with fallbacks
-                doc_id = str(file_info.get("id", f"file_{i}"))
-
-                # Try multiple ways to get filename from OpenWebUI API response
-                filename = None
-                # Check direct filename field
-                if "filename" in file_info:
-                    filename = file_info["filename"]
-                # Check name field
-                elif "name" in file_info:
-                    filename = file_info["name"]
-                # Check meta.name (from FileModelResponse schema)
-                elif isinstance(file_info.get("meta"), dict):
-                    filename = file_info["meta"].get("name")
-
-                # Final fallback
-                if not filename:
-                    filename = f"file_{i}"
-
-                filename = str(filename)
-
-                # Extract size from meta if available
-                size = 0
-                if isinstance(file_info.get("meta"), dict):
-                    size = file_info["meta"].get("size", 0)
-                else:
-                    size = file_info.get("size", 0)
-
-                # Estimate word count from file size (very rough approximation)
-                word_count = max(1, int(size / 6)) if isinstance(size, (int, float)) else 0
-
-                documents.append(
-                    {
-                        "id": doc_id,
-                        "title": filename,
-                        "source_url": "",  # OpenWebUI files don't typically have source URLs
-                        "description": f"File: {filename}",
-                        "content_type": str(file_info.get("content_type", "text/plain")),
-                        "content_preview": f"File uploaded to OpenWebUI: {filename}",
-                        "word_count": word_count,
-                        "timestamp": str(
-                            file_info.get("created_at") or file_info.get("timestamp", "")
-                        ),
-                    }
-                )
-
-            return documents
-
-        except Exception as e:
-            # Since OpenWebUI file listing API structure is not guaranteed,
-            # we gracefully fall back rather than raise an error
-            import logging
-
-            logging.warning(f"OpenWebUI document listing failed: {e}")
-
-            # Return a placeholder entry indicating limited support
-            return [
-                {
-                    "id": "api_error",
-                    "title": f"Knowledge Base: {collection_name or 'default'}",
-                    "source_url": "",
-                    "description": "Document listing encountered an error - API compatibility issue",
-                    "content_type": "text/plain",
-                    "content_preview": f"Error: {str(e)[:100]}...",
-                    "word_count": 0,
-                    "timestamp": "",
-                }
-            ]
-
-    async def close(self) -> None:
-        """Close client connection."""
-        if hasattr(self, "client") and self.client:
-            try:
-                await self.client.aclose()
-            except Exception as e:
-                import logging
-
-                logging.warning(f"Error closing OpenWebUI client: {e}")
-</file>
-
-<file path="ingest_pipeline/storage/weaviate.py">
-"""Weaviate storage adapter."""
-
-from collections.abc import AsyncGenerator, Mapping, Sequence
-from datetime import UTC, datetime
-from typing import Literal, Self, TypeAlias, cast, overload
-from uuid import UUID
-
-import weaviate
-from typing_extensions import override
-from weaviate.classes.config import Configure, DataType, Property
-from weaviate.classes.data import DataObject
-from weaviate.classes.query import Filter
-from weaviate.collections import Collection
-from weaviate.exceptions import (
-    WeaviateBatchError,
-    WeaviateConnectionError,
-    WeaviateQueryError,
-)
-
-from ..core.exceptions import StorageError
-from ..core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
-from ..utils.vectorizer import Vectorizer
-from .base import BaseStorage
-
-VectorContainer: TypeAlias = Mapping[str, object] | Sequence[object] | None
-
-
-class WeaviateStorage(BaseStorage):
-    """Storage adapter for Weaviate."""
-
-    client: weaviate.WeaviateClient | None
-    vectorizer: Vectorizer
-    _default_collection: str
-
-    def __init__(self, config: StorageConfig):
-        """
-        Initialize Weaviate storage.
-
-        Args:
-            config: Storage configuration
-        """
-        super().__init__(config)
-        self.client = None
-        self.vectorizer = Vectorizer(config)
-        self._default_collection = self._normalize_collection_name(config.collection_name)
-
-    @override
-    async def initialize(self) -> None:
-        """Initialize Weaviate client and create collection if needed."""
-        try:
-            # Let Weaviate client handle URL parsing
-            self.client = weaviate.WeaviateClient(
-                connection_params=weaviate.connect.ConnectionParams.from_url(
-                    url=str(self.config.endpoint),
-                    grpc_port=50051,  # Default gRPC port
-                ),
-                additional_config=weaviate.classes.init.AdditionalConfig(
-                    timeout=weaviate.classes.init.Timeout(init=30, query=60, insert=120),
-                ),
-            )
-
-            # Connect to the client
-            self.client.connect()
-
-            # Ensure the default collection exists
-            await self._ensure_collection(self._default_collection)
-
-        except WeaviateConnectionError as e:
-            raise StorageError(f"Failed to connect to Weaviate: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to initialize Weaviate: {e}") from e
-
-    async def _create_collection(self, collection_name: str) -> None:
-        """Create Weaviate collection with schema."""
-        if not self.client:
-            raise StorageError("Weaviate client not initialized")
-        try:
-            self.client.collections.create(
-                name=collection_name,
-                properties=[
-                    Property(
-                        name="content", data_type=DataType.TEXT, description="Document content"
-                    ),
-                    Property(name="source_url", data_type=DataType.TEXT, description="Source URL"),
-                    Property(name="title", data_type=DataType.TEXT, description="Document title"),
-                    Property(
-                        name="description",
-                        data_type=DataType.TEXT,
-                        description="Document description",
-                    ),
-                    Property(
-                        name="timestamp", data_type=DataType.DATE, description="Ingestion timestamp"
-                    ),
-                    Property(
-                        name="content_type", data_type=DataType.TEXT, description="Content type"
-                    ),
-                    Property(name="word_count", data_type=DataType.INT, description="Word count"),
-                    Property(
-                        name="char_count", data_type=DataType.INT, description="Character count"
-                    ),
-                    Property(
-                        name="source", data_type=DataType.TEXT, description="Ingestion source"
-                    ),
-                ],
-                vectorizer_config=Configure.Vectorizer.none(),
-            )
-        except Exception as e:
-            raise StorageError(f"Failed to create collection: {e}") from e
-
-    @staticmethod
-    def _extract_vector(vector_raw: VectorContainer) -> list[float] | None:
-        """Normalize vector payloads returned by Weaviate into a float list."""
-        if isinstance(vector_raw, Mapping):
-            default_vector = vector_raw.get("default")
-            return WeaviateStorage._extract_vector(
-                cast(VectorContainer, default_vector)
-            )
-
-        if not isinstance(vector_raw, Sequence) or isinstance(
-            vector_raw, (str, bytes, bytearray)
-        ):
-            return None
-
-        items = list(vector_raw)
-        if not items:
-            return None
-
-        first_item = items[0]
-        if isinstance(first_item, (int, float)):
-            numeric_items = cast(list[int | float], items)
-            try:
-                return [float(value) for value in numeric_items]
-            except (TypeError, ValueError):
-                return None
-
-        if isinstance(first_item, Sequence) and not isinstance(
-            first_item, (str, bytes, bytearray)
-        ):
-            inner_items = list(first_item)
-            if all(isinstance(item, (int, float)) for item in inner_items):
-                try:
-                    numeric_inner = cast(list[int | float], inner_items)
-                    return [float(item) for item in numeric_inner]
-                except (TypeError, ValueError):
-                    return None
-
-        return None
-
-    @staticmethod
-    def _parse_source(source_raw: object) -> IngestionSource:
-        """Safely normalize persistence source values into enum instances."""
-        if isinstance(source_raw, IngestionSource):
-            return source_raw
-
-        if isinstance(source_raw, str):
-            try:
-                return IngestionSource(source_raw)
-            except ValueError:
-                return IngestionSource.WEB
-
-        return IngestionSource.WEB
-
-    @staticmethod
-    @overload
-    def _coerce_properties(
-        properties: object,
-        *,
-        context: str,
-    ) -> Mapping[str, object]:
-        ...
-
-    @staticmethod
-    @overload
-    def _coerce_properties(
-        properties: object,
-        *,
-        context: str,
-        allow_missing: Literal[False],
-    ) -> Mapping[str, object]:
-        ...
-
-    @staticmethod
-    @overload
-    def _coerce_properties(
-        properties: object,
-        *,
-        context: str,
-        allow_missing: Literal[True],
-    ) -> Mapping[str, object] | None:
-        ...
-
-    @staticmethod
-    def _coerce_properties(
-        properties: object,
-        *,
-        context: str,
-        allow_missing: bool = False,
-    ) -> Mapping[str, object] | None:
-        """Ensure Weaviate properties payloads are mappings."""
-        if properties is None:
-            if allow_missing:
-                return None
-            raise StorageError(f"{context} returned object without properties")
-
-        if not isinstance(properties, Mapping):
-            raise StorageError(
-                f"{context} returned invalid properties payload of type {type(properties)!r}"
-            )
-
-        return cast(Mapping[str, object], properties)
-
-    def _normalize_collection_name(self, collection_name: str | None) -> str:
-        """Return a canonicalized collection name, defaulting to configured value."""
-        candidate = collection_name or self.config.collection_name
-        if not candidate:
-            raise StorageError("Collection name is required")
-
-        if normalized := candidate.strip():
-            return normalized[0].upper() + normalized[1:]
-        else:
-            raise StorageError("Collection name cannot be empty")
-
-    async def _ensure_collection(self, collection_name: str) -> None:
-        """Create the collection if missing."""
-        if not self.client:
-            raise StorageError("Weaviate client not initialized")
-
-        existing = self.client.collections.list_all()
-        if collection_name not in existing:
-            await self._create_collection(collection_name)
-
-    async def _prepare_collection(
-        self,
-        collection_name: str | None,
-        *,
-        ensure_exists: bool,
-    ) -> tuple[Collection, str]:
-        """Return a ready collection handle and normalized name."""
-        normalized = self._normalize_collection_name(collection_name)
-
-        if not self.client:
-            raise StorageError("Weaviate client not initialized")
-
-        if ensure_exists:
-            await self._ensure_collection(normalized)
-
-        return self.client.collections.get(normalized), normalized
-
-    @override
-    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
-        """
-        Store a document in Weaviate.
-
-        Args:
-            document: Document to store
-
-        Returns:
-            Document ID
-        """
-        try:
-            # Vectorize content if no vector provided
-            if document.vector is None:
-                document.vector = await self.vectorizer.vectorize(document.content)
-
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=True
-            )
-
-            # Prepare properties
-            properties = {
-                "content": document.content,
-                "source_url": document.metadata["source_url"],
-                "title": document.metadata.get("title", ""),
-                "description": document.metadata.get("description", ""),
-                "timestamp": document.metadata["timestamp"].isoformat(),
-                "content_type": document.metadata["content_type"],
-                "word_count": document.metadata["word_count"],
-                "char_count": document.metadata["char_count"],
-                "source": document.source.value,
-            }
-
-            # Insert with vector
-            result = collection.data.insert(
-                properties=properties, vector=document.vector, uuid=str(document.id)
-            )
-
-            return str(result)
-
-        except Exception as e:
-            raise StorageError(f"Failed to store document: {e}") from e
-
-    @override
-    async def store_batch(
-        self, documents: list[Document], *, collection_name: str | None = None
-    ) -> list[str]:
-        """
-        Store multiple documents using proper batch operations.
-
-        Args:
-            documents: List of documents
-
-        Returns:
-            List of successfully stored document IDs
-        """
-        try:
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=True
-            )
-
-            # Vectorize documents without vectors
-            for doc in documents:
-                if doc.vector is None:
-                    doc.vector = await self.vectorizer.vectorize(doc.content)
-
-            # Prepare batch data for insert_many
-            batch_objects = []
-            for doc in documents:
-                properties = {
-                    "content": doc.content,
-                    "source_url": doc.metadata["source_url"],
-                    "title": doc.metadata.get("title", ""),
-                    "description": doc.metadata.get("description", ""),
-                    "timestamp": doc.metadata["timestamp"].isoformat(),
-                    "content_type": doc.metadata["content_type"],
-                    "word_count": doc.metadata["word_count"],
-                    "char_count": doc.metadata["char_count"],
-                    "source": doc.source.value,
-                }
-
-                batch_objects.append(
-                    DataObject(properties=properties, vector=doc.vector, uuid=str(doc.id))
-                )
-
-            # Insert batch using insert_many
-            response = collection.data.insert_many(batch_objects)
-
-            successful_ids: list[str] = []
-            error_indices = set(response.errors.keys()) if response else set()
-
-            for index, doc in enumerate(documents):
-                if index in error_indices:
-                    continue
-
-                uuid_value = response.uuids.get(index) if response else None
-                successful_ids.append(str(uuid_value) if uuid_value is not None else str(doc.id))
-
-            if error_indices:
-                error_messages = ", ".join(
-                    f"{documents[i].id}: {response.errors[i].message}"
-                    for i in error_indices
-                    if hasattr(response.errors[i], "message")
-                )
-                print(
-                    "Weaviate partial batch failure for collection "
-                    f"{resolved_name}: {error_messages}"
-                )
-
-            return successful_ids
-
-        except WeaviateBatchError as e:
-            raise StorageError(f"Batch operation failed: {e}") from e
-        except WeaviateConnectionError as e:
-            raise StorageError(f"Connection to Weaviate failed: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Failed to store batch: {e}") from e
-
-    @override
-    async def retrieve(
-        self, document_id: str, *, collection_name: str | None = None
-    ) -> Document | None:
-        """
-        Retrieve a document from Weaviate.
-
-        Args:
-            document_id: Document ID
-
-        Returns:
-            Document or None
-        """
-        try:
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=False
-            )
-            result = collection.query.fetch_object_by_id(document_id)
-
-            if not result:
-                return None
-
-            # Reconstruct document
-            props = self._coerce_properties(
-                result.properties,
-                context="fetch_object_by_id",
-            )
-            metadata_dict = {
-                "source_url": str(props["source_url"]),
-                "title": str(props.get("title")) if props.get("title") else None,
-                "description": str(props.get("description"))
-                if props.get("description")
-                else None,
-                "timestamp": str(props["timestamp"]),
-                "content_type": str(props["content_type"]),
-                "word_count": int(str(props["word_count"])),
-                "char_count": int(str(props["char_count"])),
-            }
-            metadata = cast(DocumentMetadata, cast(object, metadata_dict))
-
-            vector = self._extract_vector(cast(VectorContainer, result.vector))
-
-            return Document(
-                id=UUID(document_id),
-                content=str(props["content"]),
-                metadata=metadata,
-                vector=vector,
-                source=self._parse_source(props.get("source")),
-                collection=resolved_name,
-            )
-
-        except WeaviateQueryError as e:
-            raise StorageError(f"Query failed: {e}") from e
-        except WeaviateConnectionError as e:
-            # Connection issues should be logged and return None
-            import logging
-            logging.warning(f"Weaviate connection error retrieving document {document_id}: {e}")
-            return None
-        except Exception as e:
-            # Log unexpected errors for debugging
-            import logging
-            logging.warning(f"Unexpected error retrieving document {document_id}: {e}")
-            return None
-
-    def _build_search_metadata(self, props: Mapping[str, object]) -> DocumentMetadata:
-        """Build metadata dictionary from Weaviate properties."""
-        metadata_dict = {
-            "source_url": str(props["source_url"]),
-            "title": str(props.get("title")) if props.get("title") else None,
-            "description": str(props.get("description"))
-            if props.get("description")
-            else None,
-            "timestamp": str(props["timestamp"]),
-            "content_type": str(props["content_type"]),
-            "word_count": int(str(props["word_count"])),
-            "char_count": int(str(props["char_count"])),
-        }
-        return cast(DocumentMetadata, cast(object, metadata_dict))
-
-    def _extract_search_score(self, result: object) -> float | None:
-        """Extract and convert search score from result metadata."""
-        metadata_obj = getattr(result, "metadata", None)
-        if metadata_obj is None:
-            return None
-
-        raw_distance = getattr(metadata_obj, "distance", None)
-        if raw_distance is None:
-            return None
-
-        try:
-            distance_value = float(raw_distance)
-            return max(0.0, 1.0 - distance_value)
-        except (TypeError, ValueError) as e:
-            import logging
-            logging.debug(f"Invalid distance value {raw_distance}: {e}")
-            return None
-
-    def _build_search_document(
-        self,
-        result: object,
-        resolved_name: str,
-    ) -> Document:
-        """Build Document from Weaviate search result."""
-        props = self._coerce_properties(
-            getattr(result, "properties", None),
-            context="search result",
-        )
-        metadata = self._build_search_metadata(props)
-
-        vector_attr = getattr(result, "vector", None)
-        vector = self._extract_vector(cast(VectorContainer, vector_attr))
-        score_value = self._extract_search_score(result)
-
-        uuid_raw = getattr(result, "uuid", None)
-        if uuid_raw is None:
-            raise StorageError("Weaviate search result missing uuid")
-        uuid_value = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
-
-        return Document(
-            id=uuid_value,
-            content=str(props["content"]),
-            metadata=metadata,
-            vector=vector,
-            source=self._parse_source(props.get("source")),
-            collection=resolved_name,
-            score=score_value,
-        )
-
-    @override
-    async def search(
-        self,
-        query: str,
-        limit: int = 10,
-        threshold: float = 0.7,
-        *,
-        collection_name: str | None = None,
-    ) -> AsyncGenerator[Document, None]:
-        """
-        Search for documents in Weaviate.
-
-        Args:
-            query: Search query
-            limit: Maximum results
-            threshold: Similarity threshold
-
-        Yields:
-            Matching documents
-        """
-        try:
-            query_vector = await self.vectorizer.vectorize(query)
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=False
-            )
-
-            results = collection.query.near_vector(
-                near_vector=query_vector,
-                limit=limit,
-                distance=1 - threshold,
-                return_metadata=["distance"],
-            )
-
-            for result in results.objects:
-                yield self._build_search_document(result, resolved_name)
-
-        except WeaviateQueryError as e:
-            raise StorageError(f"Search query failed: {e}") from e
-        except WeaviateConnectionError as e:
-            raise StorageError(f"Connection to Weaviate failed during search: {e}") from e
-        except Exception as e:
-            raise StorageError(f"Search failed: {e}") from e
-
-    @override
-    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
-        """
-        Delete a document from Weaviate.
-
-        Args:
-            document_id: Document ID
-
-        Returns:
-            True if deleted
-        """
-        try:
-            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
-            collection.data.delete_by_id(document_id)
-            return True
-        except WeaviateQueryError as e:
-            raise StorageError(f"Delete operation failed: {e}") from e
-        except Exception:
-            return False
-
-    @override
-    async def count(self, *, collection_name: str | None = None) -> int:
-        """
-        Get document count in collection.
-
-        Returns:
-            Number of documents
-        """
-        try:
-            if not self.client:
-                return 0
-            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
-            result = collection.aggregate.over_all(total_count=True)
-            return result.total_count or 0
-        except WeaviateQueryError as e:
-            raise StorageError(f"Count query failed: {e}") from e
-        except Exception:
-            return 0
-
-    async def list_collections(self) -> list[str]:
-        """
-        List all available collections.
-
-        Returns:
-            List of collection names
-        """
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            return list(self.client.collections.list_all())
-
-        except Exception as e:
-            raise StorageError(f"Failed to list collections: {e}") from e
-
-    async def describe_collections(self) -> list[dict[str, object]]:
-        """Return metadata for each Weaviate collection."""
-        if not self.client:
-            raise StorageError("Weaviate client not initialized")
-
-        try:
-            collections: list[dict[str, object]] = []
-            for name in self.client.collections.list_all():
-                collection_obj = self.client.collections.get(name)
-                if not collection_obj:
-                    continue
-
-                count = collection_obj.aggregate.over_all(total_count=True).total_count or 0
-                size_mb = count * 0.01
-                collections.append(
-                    {
-                        "name": name,
-                        "count": count,
-                        "size_mb": size_mb,
-                    }
-                )
-
-            return collections
-        except Exception as e:
-            raise StorageError(f"Failed to describe collections: {e}") from e
-
-    async def sample_documents(
-        self, limit: int = 5, *, collection_name: str | None = None
-    ) -> list[Document]:
-        """
-        Get sample documents from the collection.
-
-        Args:
-            limit: Maximum number of documents to return
-
-        Returns:
-            List of sample documents
-        """
-        try:
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=False
-            )
-
-            # Query for sample documents
-            response = collection.query.fetch_objects(limit=limit)
-
-            documents = []
-            for obj in response.objects:
-                # Convert back to Document format
-                props = self._coerce_properties(
-                    getattr(obj, "properties", None),
-                    context="sample_documents",
-                    allow_missing=True,
-                )
-                if props is None:
-                    continue
-                uuid_raw = getattr(obj, "uuid", None)
-                if uuid_raw is None:
-                    continue
-                document_id = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
-                # Safely convert WeaviateField values
-                word_count_val = props.get("word_count")
-                if isinstance(word_count_val, (int, float)):
-                    word_count = int(word_count_val)
-                elif word_count_val:
-                    word_count = int(str(word_count_val))
-                else:
-                    word_count = 0
-
-                char_count_val = props.get("char_count")
-                if isinstance(char_count_val, (int, float)):
-                    char_count = int(char_count_val)
-                elif char_count_val:
-                    char_count = int(str(char_count_val))
-                else:
-                    char_count = 0
-
-                doc = Document(
-                    id=document_id,
-                    content=str(props.get("content", "")),
-                    source=self._parse_source(props.get("source")),
-                    metadata={
-                        "source_url": str(props.get("source_url", "")),
-                        "title": str(props.get("title", "")) if props.get("title") else None,
-                        "description": str(props.get("description", ""))
-                        if props.get("description")
-                        else None,
-                        "timestamp": datetime.fromisoformat(
-                            str(props.get("timestamp", datetime.now(UTC).isoformat()))
-                        ),
-                        "content_type": str(props.get("content_type", "text/plain")),
-                        "word_count": word_count,
-                        "char_count": char_count,
-                    },
-                    collection=resolved_name,
-                )
-                documents.append(doc)
-
-            return documents
-
-        except Exception as e:
-            raise StorageError(f"Failed to sample documents: {e}") from e
-
-    def _safe_convert_count(self, value: object) -> int:
-        """Safely convert a value to integer count."""
-        if isinstance(value, (int, float)):
-            return int(value)
-        elif value:
-            return int(str(value))
-        else:
-            return 0
-
-    def _build_document_metadata(self, props: Mapping[str, object]) -> DocumentMetadata:
-        """Build metadata from search document properties."""
-        return {
-            "source_url": str(props.get("source_url", "")),
-            "title": str(props.get("title", "")) if props.get("title") else None,
-            "description": str(props.get("description", ""))
-            if props.get("description")
-            else None,
-            "timestamp": datetime.fromisoformat(
-                str(props.get("timestamp", datetime.now(UTC).isoformat()))
-            ),
-            "content_type": str(props.get("content_type", "text/plain")),
-            "word_count": self._safe_convert_count(props.get("word_count")),
-            "char_count": self._safe_convert_count(props.get("char_count")),
-        }
-
-    def _extract_document_score(self, obj: object) -> float | None:
-        """Extract score from document search result."""
-        metadata_obj = getattr(obj, "metadata", None)
-        if metadata_obj is None:
-            return None
-
-        raw_score = getattr(metadata_obj, "score", None)
-        if raw_score is None:
-            return None
-
-        try:
-            return float(raw_score)
-        except (TypeError, ValueError) as e:
-            import logging
-            logging.debug(f"Invalid score value {raw_score}: {e}")
-            return None
-
-    def _build_document_from_search(
-        self,
-        obj: object,
-        resolved_name: str,
-    ) -> Document:
-        """Build Document from search document result."""
-        props = self._coerce_properties(
-            getattr(obj, "properties", None),
-            context="document search result",
-        )
-        metadata = self._build_document_metadata(props)
-        score_value = self._extract_document_score(obj)
-
-        uuid_raw = getattr(obj, "uuid", None)
-        if uuid_raw is None:
-            raise StorageError("Weaviate search document result missing uuid")
-        uuid_value = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
-
-        return Document(
-            id=uuid_value,
-            content=str(props.get("content", "")),
-            source=self._parse_source(props.get("source")),
-            metadata=metadata,
-            collection=resolved_name,
-            score=score_value,
-        )
-
-    async def search_documents(
-        self, query: str, limit: int = 10, *, collection_name: str | None = None
-    ) -> list[Document]:
-        """
-        Search documents in the collection.
-
-        Args:
-            query: Search query
-            limit: Maximum number of results
-
-        Returns:
-            List of matching documents
-        """
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=False
-            )
-
-            # Try hybrid search first, fall back to BM25 keyword search
-            try:
-                response = collection.query.hybrid(
-                    query=query, limit=limit, return_metadata=["score"]
-                )
-            except Exception:
-                response = collection.query.bm25(
-                    query=query, limit=limit, return_metadata=["score"]
-                )
-
-            return [
-                self._build_document_from_search(obj, resolved_name)
-                for obj in response.objects
-            ]
-
-        except Exception as e:
-            raise StorageError(f"Failed to search documents: {e}") from e
-
-    async def list_documents(
-        self,
-        limit: int = 100,
-        offset: int = 0,
-        *,
-        collection_name: str | None = None,
-    ) -> list[dict[str, object]]:
-        """
-        List documents in the collection with pagination.
-
-        Args:
-            limit: Maximum number of documents to return
-            offset: Number of documents to skip
-
-        Returns:
-            List of document dictionaries with id, title, source_url, and content preview
-        """
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
-
-            # Query documents with pagination
-            response = collection.query.fetch_objects(
-                limit=limit, offset=offset, return_metadata=["creation_time"]
-            )
-
-            documents: list[dict[str, object]] = []
-            for obj in response.objects:
-                props = self._coerce_properties(
-                    obj.properties,
-                    context="list_documents",
-                    allow_missing=True,
-                )
-                if props is None:
-                    continue
-                content = str(props.get("content", ""))
-                word_count_value = props.get("word_count", 0)
-                # Convert WeaviateField to int
-                if isinstance(word_count_value, (int, float)):
-                    word_count = int(word_count_value)
-                elif word_count_value:
-                    word_count = int(str(word_count_value))
-                else:
-                    word_count = 0
-
-                doc_info: dict[str, object] = {
-                    "id": str(obj.uuid),
-                    "title": str(props.get("title", "Untitled")),
-                    "source_url": str(props.get("source_url", "")),
-                    "description": str(props.get("description", "")),
-                    "content_type": str(props.get("content_type", "text/plain")),
-                    "content_preview": (f"{content[:200]}..." if len(content) > 200 else content),
-                    "word_count": word_count,
-                    "timestamp": str(props.get("timestamp", "")),
-                }
-                documents.append(doc_info)
-
-            return documents
-
-        except Exception as e:
-            raise StorageError(f"Failed to list documents: {e}") from e
-
-    async def delete_documents(
-        self, document_ids: list[str], *, collection_name: str | None = None
-    ) -> dict[str, bool]:
-        """
-        Delete multiple documents from Weaviate.
-
-        Args:
-            document_ids: List of document IDs to delete
-
-        Returns:
-            Dictionary mapping document IDs to deletion success status
-        """
-        results: dict[str, bool] = {}
-
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            if not document_ids:
-                return results
-
-            collection, resolved_name = await self._prepare_collection(
-                collection_name, ensure_exists=False
-            )
-
-            delete_filter = Filter.by_id().contains_any(document_ids)
-            response = collection.data.delete_many(where=delete_filter, verbose=True)
-
-            if objects := getattr(response, "objects", None):
-                for result_obj in objects:
-                    if doc_uuid := str(getattr(result_obj, "uuid", "")):
-                        results[doc_uuid] = bool(getattr(result_obj, "successful", False))
-
-            if len(results) < len(document_ids):
-                default_success = getattr(response, "failed", 0) == 0
-                for doc_id in document_ids:
-                    _ = results.setdefault(doc_id, default_success)
-
-            return results
-
-        except Exception as e:
-            raise StorageError(f"Failed to delete documents: {e}") from e
-
-    async def delete_by_filter(
-        self, filter_dict: dict[str, str], *, collection_name: str | None = None
-    ) -> int:
-        """
-        Delete documents matching a filter.
-
-        Args:
-            filter_dict: Filter criteria (e.g., {"source_url": "example.com"})
-
-        Returns:
-            Number of documents deleted
-        """
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
-
-            # Build where filter
-            where_filter = None
-            if "source_url" in filter_dict:
-                where_filter = Filter.by_property("source_url").equal(filter_dict["source_url"])
-
-            # Get documents matching filter
-            if where_filter:
-                response = collection.query.fetch_objects(
-                    filters=where_filter,
-                    limit=1000,  # Max batch size
-                )
-            else:
-                response = collection.query.fetch_objects(
-                    limit=1000  # Max batch size
-                )
-
-            # Delete matching documents
-            deleted_count = 0
-            for obj in response.objects:
-                try:
-                    collection.data.delete_by_id(obj.uuid)
-                    deleted_count += 1
-                except Exception:
-                    continue
-
-            return deleted_count
-
-        except Exception as e:
-            raise StorageError(f"Failed to delete by filter: {e}") from e
-
-    async def delete_collection(self, collection_name: str | None = None) -> bool:
-        """
-        Delete the entire collection.
-
-        Returns:
-            True if successful
-        """
-        try:
-            if not self.client:
-                raise StorageError("Weaviate client not initialized")
-
-            target = self._normalize_collection_name(collection_name)
-
-            # Delete the collection using the client's collections API
-            self.client.collections.delete(target)
-
-            return True
-
-        except Exception as e:
-            raise StorageError(f"Failed to delete collection: {e}") from e
-
-    async def __aenter__(self) -> Self:
-        """Async context manager entry."""
-        return self
-
-    async def __aexit__(
-        self,
-        exc_type: type[BaseException] | None,
-        exc_val: BaseException | None,
-        exc_tb: object | None,
-    ) -> None:
-        """Async context manager exit with proper cleanup."""
-        await self.close()
-
-    async def close(self) -> None:
-        """Close client connection."""
-        if self.client:
-            try:
-                self.client.close()
-            except Exception as e:
-                import logging
-                logging.warning(f"Error closing Weaviate client: {e}")
-
-    def __del__(self) -> None:
-        """Clean up client connection as fallback."""
-        if self.client:
-            try:
-                self.client.close()
-            except Exception:
-                pass  # Ignore errors in destructor
-</file>
-
 <file path="ingest_pipeline/utils/metadata_tagger.py">
 """Metadata tagger for enriching documents with AI-generated tags and metadata."""
 
@@ -14041,4 +9126,5032 @@ class Vectorizer:
         await self.client.aclose()
 </file>
 
+<file path="ingest_pipeline/cli/tui/screens/dashboard.py">
+"""Main dashboard screen with collections overview."""
+
+import logging
+from datetime import datetime
+from typing import TYPE_CHECKING, Final
+
+from textual import work
+from textual.app import ComposeResult
+from textual.binding import Binding
+from textual.containers import Container, Grid, Horizontal
+from textual.css.query import NoMatches
+from textual.reactive import reactive, var
+from textual.screen import Screen
+from textual.widgets import (
+    Button,
+    Footer,
+    Header,
+    LoadingIndicator,
+    Rule,
+    Static,
+    TabbedContent,
+    TabPane,
+)
+from typing_extensions import override
+
+from ....core.models import StorageBackend
+from ....storage.base import BaseStorage
+from ....storage.openwebui import OpenWebUIStorage
+from ....storage.weaviate import WeaviateStorage
+from ..models import CollectionInfo
+from ..utils.storage_manager import StorageManager
+from ..widgets import EnhancedDataTable, MetricsCard, StatusIndicator
+
+if TYPE_CHECKING:
+    from ....storage.r2r.storage import R2RStorage
+else:  # pragma: no cover - optional dependency fallback
+    R2RStorage = BaseStorage
+
+
+LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
+
+
+class CollectionOverviewScreen(Screen[None]):
+    """Enhanced dashboard with modern design and metrics."""
+
+    total_documents: int = 0
+    total_collections: int = 0
+    active_backends: int = 0
+
+    BINDINGS = [
+        Binding("q", "quit", "Quit"),
+        Binding("r", "refresh", "Refresh"),
+        Binding("i", "ingest", "Ingest"),
+        Binding("m", "manage", "Manage"),
+        Binding("s", "search", "Search"),
+        Binding("ctrl+d", "delete", "Delete"),
+        Binding("ctrl+1", "tab_dashboard", "Dashboard"),
+        Binding("ctrl+2", "tab_collections", "Collections"),
+        Binding("ctrl+3", "tab_analytics", "Analytics"),
+        Binding("tab", "next_tab", "Next Tab"),
+        Binding("shift+tab", "prev_tab", "Prev Tab"),
+        Binding("f1", "help", "Help"),
+    ]
+
+    collections: var[list[CollectionInfo]] = var([])
+    is_loading: var[bool] = var(False)
+    selected_collection: reactive[CollectionInfo | None] = reactive(None)
+    storage_manager: StorageManager
+    weaviate: WeaviateStorage | None
+    openwebui: OpenWebUIStorage | None
+    r2r: R2RStorage | BaseStorage | None
+
+    def __init__(
+        self,
+        storage_manager: StorageManager,
+        weaviate: WeaviateStorage | None,
+        openwebui: OpenWebUIStorage | None,
+        r2r: R2RStorage | BaseStorage | None,
+    ) -> None:
+        super().__init__()
+        self.storage_manager = storage_manager
+        self.weaviate = weaviate
+        self.openwebui = openwebui
+        self.r2r = r2r
+        self.total_documents = 0
+        self.total_collections = 0
+        self.active_backends = 0
+
+    @override
+    def compose(self) -> ComposeResult:
+        yield Header(show_clock=True)
+
+        with TabbedContent():
+            # Dashboard Tab
+            with TabPane("Dashboard", id="dashboard"):
+                yield Container(
+                    Static("🚀 Collection Management System", classes="title"),
+                    Static("Modern document ingestion and management platform", classes="subtitle"),
+                    Rule(line_style="heavy"),
+                    # Metrics Grid
+                    Container(
+                        Grid(
+                            MetricsCard(
+                                "Collections", str(self.total_collections), "Active collections"
+                            ),
+                            MetricsCard("Documents", str(self.total_documents), "Total indexed"),
+                            MetricsCard(
+                                "Backends", str(self.active_backends), "Connected services"
+                            ),
+                            MetricsCard("Status", "Online", "System health"),
+                            classes="responsive-grid metrics-grid",
+                        ),
+                        classes="center",
+                    ),
+                    Rule(line_style="dashed"),
+                    # Quick Actions
+                    Container(
+                        Static("⚡ Quick Actions", classes="section-title"),
+                        Horizontal(
+                            Button("🔄 Refresh Data", id="quick_refresh", variant="primary"),
+                            Button("📥 New Ingestion", id="quick_ingest", variant="success"),
+                            Button("🔍 Search All", id="quick_search", variant="default"),
+                            Button("⚙️ Settings", id="quick_settings", variant="default"),
+                            classes="action_buttons",
+                        ),
+                        classes="card",
+                    ),
+                    # Recent Activity
+                    Container(
+                        Static("📊 Recent Activity", classes="section-title"),
+                        Static(
+                            "Loading recent activity...", id="activity_feed", classes="status-text"
+                        ),
+                        classes="card",
+                    ),
+                    classes="main_container",
+                )
+
+            # Collections Tab
+            with TabPane("Collections", id="collections"):
+                yield Container(
+                    Static("📚 Collection Overview", classes="title"),
+                    # Collection controls
+                    Horizontal(
+                        Button("🔄 Refresh", id="refresh_btn", variant="primary"),
+                        Button("📥 Ingest", id="ingest_btn", variant="success"),
+                        Button("🔧 Manage", id="manage_btn", variant="warning"),
+                        Button("🗑️ Delete", id="delete_btn", variant="error"),
+                        Button("🔍 Search", id="search_btn", variant="default"),
+                        classes="button_bar",
+                    ),
+                    # Collection table with enhanced navigation
+                    EnhancedDataTable(id="collections_table", classes="enhanced-table"),
+                    # Status bar
+                    Container(
+                        Static("Ready", id="status_text", classes="status-text"),
+                        StatusIndicator("Ready", id="connection_status"),
+                        classes="status-bar",
+                    ),
+                    LoadingIndicator(id="loading", classes="pulse"),
+                    classes="main_container",
+                )
+
+            # Analytics Tab
+            with TabPane("Analytics", id="analytics"):
+                yield Container(
+                    Static("📈 Analytics & Insights", classes="title"),
+                    # Analytics content
+                    Container(
+                        Static("🚧 Analytics Dashboard", classes="section-title"),
+                        Static("Advanced analytics and insights coming soon!", classes="subtitle"),
+                        # Placeholder charts area
+                        Container(
+                            Static("📊 Document Distribution", classes="chart-title"),
+                            Static(
+                                "Chart placeholder - integrate with visualization library",
+                                classes="chart-placeholder",
+                            ),
+                            classes="card",
+                        ),
+                        Container(
+                            Static("⏱️ Ingestion Timeline", classes="chart-title"),
+                            Static("Timeline chart placeholder", classes="chart-placeholder"),
+                            classes="card",
+                        ),
+                        classes="analytics-grid",
+                    ),
+                    classes="main_container",
+                )
+
+        yield Footer()
+
+    async def on_mount(self) -> None:
+        """Initialize the screen with enhanced loading."""
+        self.query_one("#loading").display = False
+        self.update_metrics()
+        self.refresh_collections()  # Don't await, let it run as a worker
+
+    def update_metrics(self) -> None:
+        """Update dashboard metrics with enhanced calculations."""
+        self._calculate_metrics()
+        self._update_metrics_cards()
+        self._update_activity_feed()
+
+    def _calculate_metrics(self) -> None:
+        """Calculate basic metrics from collections."""
+        self.total_collections = len(self.collections)
+        self.total_documents = sum(col["count"] for col in self.collections)
+        self.active_backends = sum([bool(self.weaviate), bool(self.openwebui), bool(self.r2r)])
+
+    def _update_metrics_cards(self) -> None:
+        """Update the metrics cards display."""
+        try:
+            dashboard_tab = self.query_one("#dashboard")
+            metrics_cards_query = dashboard_tab.query(MetricsCard)
+            if len(metrics_cards_query) >= 4:
+                metrics_cards = list(metrics_cards_query)
+                self._update_card_values(metrics_cards)
+                self._update_status_card(metrics_cards[3])
+        except NoMatches:
+            return
+        except Exception as exc:
+            LOGGER.exception("Failed to update dashboard metrics", exc_info=exc)
+
+    def _update_card_values(self, metrics_cards: list[MetricsCard]) -> None:
+        """Update individual metric card values."""
+        metrics_cards[0].query_one(".metrics-value", Static).update(f"{self.total_collections:,}")
+        metrics_cards[1].query_one(".metrics-value", Static).update(f"{self.total_documents:,}")
+        metrics_cards[2].query_one(".metrics-value", Static).update(str(self.active_backends))
+
+    def _update_status_card(self, status_card: MetricsCard) -> None:
+        """Update the system status card."""
+        if self.active_backends > 0 and self.total_collections > 0:
+            status_text, status_class = "🟢 Healthy", "status-active"
+        elif self.active_backends > 0:
+            status_text, status_class = "🟡 Ready", "status-warning"
+        else:
+            status_text, status_class = "🔴 Offline", "status-error"
+
+        status_card.query_one(".metrics-value", Static).update(status_text)
+        status_card.add_class(status_class)
+
+    def _update_activity_feed(self) -> None:
+        """Update the activity feed with collection data."""
+        try:
+            dashboard_tab = self.query_one("#dashboard")
+            activity_feed = dashboard_tab.query_one("#activity_feed", Static)
+            activity_text = self._generate_activity_text()
+            activity_feed.update(activity_text)
+        except NoMatches:
+            return
+        except Exception as exc:
+            LOGGER.exception("Failed to update dashboard activity feed", exc_info=exc)
+
+    def _generate_activity_text(self) -> str:
+        """Generate activity feed text from collections."""
+        if not self.collections:
+            return "🚀 No collections found. Start by creating your first ingestion!\n💡 Press 'I' to begin or use the Quick Actions above."
+
+        recent_activity = [self._format_collection_item(col) for col in self.collections[:3]]
+        activity_text = "\n".join(recent_activity)
+
+        if len(self.collections) > 3:
+            total_docs = sum(c["count"] for c in self.collections)
+            activity_text += (
+                f"\n📊 Total: {len(self.collections)} collections with {total_docs:,} documents"
+            )
+
+        return activity_text
+
+    def _format_collection_item(self, col: CollectionInfo) -> str:
+        """Format a single collection item for the activity feed."""
+        content_type = self._get_content_type_icon(col["name"])
+        size_mb = col["size_mb"]
+        backend_info = col["backend"]
+
+        # Check if this represents a multi-backend ingestion result
+        if isinstance(backend_info, list):
+            if len(backend_info) > 1:
+                # Ensure all elements are strings for safe joining
+                backend_strings = [str(b) for b in backend_info if b is not None]
+                backend_list = " + ".join(backend_strings) if backend_strings else "unknown"
+                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) → {backend_list}"
+            elif len(backend_info) == 1:
+                backend_name = str(backend_info[0]) if backend_info[0] is not None else "unknown"
+                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - {backend_name}"
+            else:
+                return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - unknown"
+        else:
+            backend_display = str(backend_info) if backend_info is not None else "unknown"
+            return f"{content_type} {col['name']}: {col['count']:,} docs ({size_mb:.1f} MB) - {backend_display}"
+
+    def _get_content_type_icon(self, name: str) -> str:
+        """Get appropriate icon for collection content type."""
+        name_lower = name.lower()
+        if "web" in name_lower:
+            return "🌐"
+        elif "doc" in name_lower:
+            return "📖"
+        elif "repo" in name_lower:
+            return "📦"
+        return "📄"
+
+    @work(exclusive=True)
+    async def refresh_collections(self) -> None:
+        """Refresh collection data with enhanced multi-backend loading feedback."""
+        self.is_loading = True
+        loading_indicator = self.query_one("#loading")
+        status_text = self.query_one("#status_text", Static)
+
+        loading_indicator.display = True
+        status_text.update("🔄 Refreshing collections...")
+
+        try:
+            # Use storage manager for unified backend handling
+            if not self.storage_manager.is_initialized:
+                status_text.update("🔗 Initializing storage backends...")
+                backend_results = await self.storage_manager.initialize_all_backends()
+
+                # Report per-backend initialization status
+                success_count = sum(backend_results.values())
+                total_count = len(backend_results)
+                status_text.update(f"✅ Initialized {success_count}/{total_count} backends")
+
+            # Get collections from all backends via storage manager
+            status_text.update("📚 Loading collections from all backends...")
+            collections = await self.storage_manager.get_all_collections()
+
+            # Update metrics calculation for multi-backend support
+            self.active_backends = len(self.storage_manager.get_available_backends())
+
+            self.collections = collections
+            await self.update_collections_table()
+            self.update_metrics()
+
+            # Enhanced status reporting for multi-backend
+            backend_names = ", ".join(
+                backend.value for backend in self.storage_manager.get_available_backends()
+            )
+            status_text.update(f"✨ Ready - {len(collections)} collections from {backend_names}")
+
+            # Update connection status with multi-backend awareness
+            connection_status = self.query_one("#connection_status", StatusIndicator)
+            if collections and self.active_backends > 0:
+                connection_status.update_status(f"✓ {self.active_backends} Active")
+            else:
+                connection_status.update_status("No Data")
+
+        except Exception as e:
+            status_text.update(f"❌ Error: {e}")
+            self.notify(f"Failed to refresh: {e}", severity="error", markup=False)
+        finally:
+            self.is_loading = False
+            loading_indicator.display = False
+
+    async def list_weaviate_collections(self) -> list[CollectionInfo]:
+        """List Weaviate collections with enhanced metadata."""
+        if not self.weaviate:
+            return []
+
+        try:
+            overview = await self.weaviate.describe_collections()
+            collections: list[CollectionInfo] = []
+
+            for item in overview:
+                count_raw = item.get("count", 0)
+                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
+                size_mb_raw = item.get("size_mb", 0.0)
+                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
+                collections.append(
+                    CollectionInfo(
+                        name=str(item.get("name", "Unknown")),
+                        type="weaviate",
+                        count=count_val,
+                        backend="🗄️ Weaviate",
+                        status="✓ Active",
+                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
+                        size_mb=size_mb_val,
+                    )
+                )
+
+            return collections
+        except Exception as e:
+            self.notify(f"Error listing Weaviate collections: {e}", severity="error", markup=False)
+            return []
+
+    async def list_openwebui_collections(self) -> list[CollectionInfo]:
+        """List OpenWebUI collections with enhanced metadata."""
+        # Try to get OpenWebUI backend from storage manager if direct instance not available
+        openwebui_backend = self.openwebui
+        if not openwebui_backend:
+            backend = self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
+            if not isinstance(backend, OpenWebUIStorage):
+                return []
+            openwebui_backend = backend
+        if not openwebui_backend:
+            return []
+
+        try:
+            overview = await openwebui_backend.describe_collections()
+            collections: list[CollectionInfo] = []
+
+            for item in overview:
+                count_raw = item.get("count", 0)
+                count_val = int(count_raw) if isinstance(count_raw, (int, str)) else 0
+                size_mb_raw = item.get("size_mb", 0.0)
+                size_mb_val = float(size_mb_raw) if isinstance(size_mb_raw, (int, float, str)) else 0.0
+                collection_name = str(item.get("name", "Unknown"))
+                collections.append(
+                    CollectionInfo(
+                        name=collection_name,
+                        type="openwebui",
+                        count=count_val,
+                        backend="🌐 OpenWebUI",
+                        status="✓ Active",
+                        last_updated=datetime.now().strftime("%Y-%m-%d %H:%M"),
+                        size_mb=size_mb_val,
+                    )
+                )
+
+            return collections
+        except Exception as e:
+            self.notify(f"Error listing OpenWebUI collections: {e}", severity="error", markup=False)
+            return []
+
+    async def update_collections_table(self) -> None:
+        """Update the collections table with enhanced formatting."""
+        table = self.query_one("#collections_table", EnhancedDataTable)
+        table.clear(columns=True)
+
+        # Add enhanced columns with more metadata
+        table.add_columns("Collection", "Backend", "Documents", "Size", "Type", "Status", "Updated")
+
+        # Add rows with enhanced formatting
+        for collection in self.collections:
+            # Format size
+            size_str = f"{collection['size_mb']:.1f} MB"
+            if collection["size_mb"] > 1000:
+                size_str = f"{collection['size_mb'] / 1000:.1f} GB"
+
+            # Format document count
+            doc_count = f"{collection['count']:,}"
+
+            # Determine content type based on collection name or other metadata
+            content_type = "📄 Mixed"
+            if "web" in collection["name"].lower():
+                content_type = "🌐 Web"
+            elif "doc" in collection["name"].lower():
+                content_type = "📖 Docs"
+            elif "repo" in collection["name"].lower():
+                content_type = "📦 Code"
+
+            table.add_row(
+                collection["name"],
+                collection["backend"],
+                doc_count,
+                size_str,
+                content_type,
+                collection["status"],
+                collection["last_updated"],
+            )
+
+        if self.collections:
+            table.move_cursor(row=0)
+
+        self.get_selected_collection()
+
+    def update_search_controls(self, collection: CollectionInfo | None) -> None:
+        """Enable or disable search controls based on backend support."""
+        try:
+            search_button = self.query_one("#search_btn", Button)
+            quick_search_button = self.query_one("#quick_search", Button)
+        except Exception:
+            return
+
+        is_weaviate = bool(collection and collection.get("type") == "weaviate")
+        search_button.disabled = not is_weaviate
+        quick_search_button.disabled = not is_weaviate
+
+    def get_selected_collection(self) -> CollectionInfo | None:
+        """Get the currently selected collection."""
+        table = self.query_one("#collections_table", EnhancedDataTable)
+        try:
+            row_index = table.cursor_coordinate.row
+        except (AttributeError, IndexError):
+            self.selected_collection = None
+            self.update_search_controls(None)
+            return None
+
+        if 0 <= row_index < len(self.collections):
+            collection = self.collections[row_index]
+            self.selected_collection = collection
+            self.update_search_controls(collection)
+            return collection
+
+        self.selected_collection = None
+        self.update_search_controls(None)
+        return None
+
+    # Action methods
+    def action_refresh(self) -> None:
+        """Refresh collections."""
+        self.refresh_collections()
+
+    def action_ingest(self) -> None:
+        """Show enhanced ingestion dialog."""
+        if selected := self.get_selected_collection():
+            from .ingestion import IngestionScreen
+
+            self.app.push_screen(IngestionScreen(selected, self.storage_manager))
+        else:
+            self.notify("🔍 Please select a collection first", severity="warning")
+
+    def action_manage(self) -> None:
+        """Manage documents in selected collection."""
+        if selected := self.get_selected_collection():
+            if storage_backend := self._get_storage_for_collection(selected):
+                from .documents import DocumentManagementScreen
+
+                self.app.push_screen(DocumentManagementScreen(selected, storage_backend))
+            else:
+                self.notify(
+                    "🚧 No storage backend available for this collection", severity="warning"
+                )
+        else:
+            self.notify("🔍 Please select a collection first", severity="warning")
+
+    def _get_storage_for_collection(self, collection: CollectionInfo) -> BaseStorage | None:
+        """Get the appropriate storage backend for a collection."""
+        collection_type = collection.get("type", "")
+
+        # Map collection types to storage backends (try direct instances first)
+        if collection_type == "weaviate" and self.weaviate:
+            return self.weaviate
+        elif collection_type == "openwebui" and self.openwebui:
+            return self.openwebui
+        elif collection_type == "r2r" and self.r2r:
+            return self.r2r
+
+        # Fall back to storage manager if direct instances not available
+        if collection_type == "weaviate":
+            return self.storage_manager.get_backend(StorageBackend.WEAVIATE)
+        elif collection_type == "openwebui":
+            return self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
+        elif collection_type == "r2r":
+            return self.storage_manager.get_backend(StorageBackend.R2R)
+
+        # Fall back to checking available backends by backend name
+        backend_name = collection.get("backend", "")
+        if isinstance(backend_name, str):
+            if "weaviate" in backend_name.lower():
+                return self.weaviate or self.storage_manager.get_backend(StorageBackend.WEAVIATE)
+            elif "openwebui" in backend_name.lower():
+                return self.openwebui or self.storage_manager.get_backend(StorageBackend.OPEN_WEBUI)
+            elif "r2r" in backend_name.lower():
+                return self.r2r or self.storage_manager.get_backend(StorageBackend.R2R)
+
+        return None
+
+    def action_search(self) -> None:
+        """Search in selected collection."""
+        if selected := self.get_selected_collection():
+            if selected["type"] != "weaviate":
+                self.notify(
+                    "🔐 Search is currently available only for Weaviate collections",
+                    severity="warning",
+                )
+                return
+            from .search import SearchScreen
+
+            self.app.push_screen(SearchScreen(selected, self.weaviate, self.openwebui))
+        else:
+            self.notify("🔍 Please select a collection first", severity="warning")
+
+    def action_delete(self) -> None:
+        """Delete selected collection."""
+        if selected := self.get_selected_collection():
+            from .dialogs import ConfirmDeleteScreen
+
+            self.app.push_screen(ConfirmDeleteScreen(selected, self))
+        else:
+            self.notify("🔍 Please select a collection first", severity="warning")
+
+    def action_tab_dashboard(self) -> None:
+        """Switch to dashboard tab."""
+        tabbed_content: TabbedContent = self.query_one(TabbedContent)
+        tabbed_content.active = "dashboard"
+
+    def action_tab_collections(self) -> None:
+        """Switch to collections tab."""
+        tabbed_content: TabbedContent = self.query_one(TabbedContent)
+        tabbed_content.active = "collections"
+
+    def action_tab_analytics(self) -> None:
+        """Switch to analytics tab."""
+        tabbed_content: TabbedContent = self.query_one(TabbedContent)
+        tabbed_content.active = "analytics"
+
+    def action_next_tab(self) -> None:
+        """Switch to next tab."""
+        tabbed_content: TabbedContent = self.query_one(TabbedContent)
+        tab_ids = ["dashboard", "collections", "analytics"]
+        current = tabbed_content.active
+        try:
+            current_index = tab_ids.index(current)
+            next_index = (current_index + 1) % len(tab_ids)
+            tabbed_content.active = tab_ids[next_index]
+        except (ValueError, AttributeError):
+            tabbed_content.active = tab_ids[0]
+
+    def action_prev_tab(self) -> None:
+        """Switch to previous tab."""
+        tabbed_content: TabbedContent = self.query_one(TabbedContent)
+        tab_ids = ["dashboard", "collections", "analytics"]
+        current = tabbed_content.active
+        try:
+            current_index = tab_ids.index(current)
+            prev_index = (current_index - 1) % len(tab_ids)
+            tabbed_content.active = tab_ids[prev_index]
+        except (ValueError, AttributeError):
+            tabbed_content.active = tab_ids[0]
+
+    def action_help(self) -> None:
+        """Show help screen."""
+        from .help import HelpScreen
+
+        help_md = """
+# 🚀 Modern Collection Management System
+
+## Navigation
+- **Tab** / **Shift+Tab**: Switch between tabs
+- **Ctrl+1/2/3**: Direct tab access
+- **Enter**: Activate selected item
+- **Escape**: Go back/cancel
+- **Arrow Keys**: Navigate within tables
+- **Home/End**: Jump to first/last row
+- **Page Up/Down**: Scroll by page
+
+## Collections
+- **R**: Refresh collections
+- **I**: Start ingestion
+- **M**: Manage documents
+- **S**: Search collection
+- **Ctrl+D**: Delete collection
+
+## Table Navigation
+- **Up/Down** or **J/K**: Navigate rows
+- **Space**: Toggle selection
+- **Ctrl+A**: Select all
+- **Ctrl+Shift+A**: Clear selection
+
+## General
+- **Q** / **Ctrl+C**: Quit application
+- **F1**: Show this help
+
+Enjoy the enhanced interface! 🎉
+        """
+        self.app.push_screen(HelpScreen(help_md))
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle button presses with enhanced feedback."""
+        button_id = event.button.id
+
+        # Add visual feedback
+        event.button.add_class("pressed")
+        self.call_later(self.remove_pressed_class, event.button)
+
+        if getattr(event.button, "disabled", False):
+            self.notify(
+                "🔐 Search is currently limited to Weaviate collections",
+                severity="warning",
+            )
+            return
+
+        if button_id in ["refresh_btn", "quick_refresh"]:
+            self.action_refresh()
+        elif button_id in ["ingest_btn", "quick_ingest"]:
+            self.action_ingest()
+        elif button_id == "manage_btn":
+            self.action_manage()
+        elif button_id == "delete_btn":
+            self.action_delete()
+        elif button_id in ["search_btn", "quick_search"]:
+            self.action_search()
+        elif button_id == "quick_settings":
+            self.notify("⚙️ Settings panel coming soon!", severity="information")
+
+    def remove_pressed_class(self, button: Button) -> None:
+        """Remove pressed visual feedback class."""
+        button.remove_class("pressed")
+</file>
+
+<file path="ingest_pipeline/cli/tui/screens/dialogs.py">
+"""Dialog screens for confirmations and user interactions."""
+
+from __future__ import annotations
+
+from pathlib import Path
+from typing import TYPE_CHECKING, ClassVar
+
+from textual.app import ComposeResult
+from textual.binding import Binding
+from textual.containers import Container, Horizontal
+from textual.screen import ModalScreen, Screen
+from textual.widgets import Button, Footer, Header, LoadingIndicator, RichLog, Static
+from typing_extensions import override
+
+from ..models import CollectionInfo
+
+if TYPE_CHECKING:
+    from .dashboard import CollectionOverviewScreen
+    from .documents import DocumentManagementScreen
+
+
+class ConfirmDeleteScreen(Screen[None]):
+    """Screen for confirming collection deletion."""
+
+    collection: CollectionInfo
+    parent_screen: CollectionOverviewScreen
+
+    BINDINGS: list[Binding] = [
+        Binding("escape", "app.pop_screen", "Cancel"),
+        Binding("y", "confirm_delete", "Yes"),
+        Binding("n", "app.pop_screen", "No"),
+        Binding("enter", "confirm_delete", "Confirm"),
+    ]
+
+    def __init__(self, collection: CollectionInfo, parent_screen: CollectionOverviewScreen):
+        super().__init__()
+        self.collection = collection
+        self.parent_screen = parent_screen
+
+    @override
+    def compose(self) -> ComposeResult:
+        yield Header()
+        yield Container(
+            Static("⚠️  Confirm Deletion", classes="title warning"),
+            Static(f"Are you sure you want to delete collection '{self.collection['name']}'?"),
+            Static(f"Backend: {self.collection['backend']}"),
+            Static(f"Documents: {self.collection['count']:,}"),
+            Static("This action cannot be undone!", classes="warning"),
+            Static("Press Y to confirm, N or Escape to cancel", classes="subtitle"),
+            Horizontal(
+                Button("✅ Yes, Delete (Y)", id="yes_btn", variant="error"),
+                Button("❌ Cancel (N)", id="no_btn", variant="default"),
+                classes="action_buttons",
+            ),
+            classes="main_container center",
+        )
+        yield Footer()
+
+    def on_mount(self) -> None:
+        """Initialize the screen with focus on cancel button for safety."""
+        self.query_one("#no_btn").focus()
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle button presses."""
+        if event.button.id == "yes_btn":
+            self.action_confirm_delete()
+        elif event.button.id == "no_btn":
+            self.app.pop_screen()
+
+    def action_confirm_delete(self) -> None:
+        """Confirm deletion."""
+        self.run_worker(self.delete_collection())
+
+    async def delete_collection(self) -> None:
+        """Delete the collection."""
+        try:
+            if self.collection["type"] == "weaviate" and self.parent_screen.weaviate:
+                # Delete Weaviate collection
+                if self.parent_screen.weaviate.client and self.parent_screen.weaviate.client.collections:
+                    self.parent_screen.weaviate.client.collections.delete(self.collection["name"])
+                self.notify(
+                    f"Deleted Weaviate collection: {self.collection['name']}",
+                    severity="information",
+                )
+            else:
+                # Use the dashboard's method to get the appropriate storage backend
+                storage_backend = self.parent_screen._get_storage_for_collection(self.collection)
+                if not storage_backend:
+                    self.notify(
+                        f"❌ No storage backend available for {self.collection['type']} collection: {self.collection['name']}",
+                        severity="error",
+                    )
+                    self.app.pop_screen()
+                    return
+
+                # Check if the storage backend supports collection deletion
+                if not hasattr(storage_backend, 'delete_collection'):
+                    self.notify(
+                        f"❌ Collection deletion not supported for {self.collection['type']} backend",
+                        severity="error",
+                    )
+                    self.app.pop_screen()
+                    return
+
+                # Delete the collection using the appropriate backend
+                # Ensure we use the exact collection name, not any default from storage config
+                collection_name = str(self.collection["name"])
+                collection_type = str(self.collection["type"])
+
+                self.notify(f"Deleting {collection_type} collection: {collection_name}...", severity="information")
+
+                # Use the standard delete_collection method for all backends
+                if hasattr(storage_backend, 'delete_collection'):
+                    success = await storage_backend.delete_collection(collection_name)
+                else:
+                    self.notify("❌ Backend does not support collection deletion", severity="error")
+                    self.app.pop_screen()
+                    return
+                if success:
+                    self.notify(
+                        f"✅ Successfully deleted {self.collection['type']} collection: {self.collection['name']}",
+                        severity="information",
+                        timeout=3.0,
+                    )
+                else:
+                    self.notify(
+                        f"❌ Failed to delete {self.collection['type']} collection: {self.collection['name']}",
+                        severity="error",
+                    )
+                    # Don't refresh if deletion failed
+                    self.app.pop_screen()
+                    return
+
+            # Refresh parent screen after a short delay to ensure deletion is processed
+            self.call_later(lambda _: self.parent_screen.refresh_collections(), 0.5)  # 500ms delay
+            self.app.pop_screen()
+
+        except Exception as e:
+            self.notify(f"Failed to delete collection: {e}", severity="error", markup=False)
+
+
+
+class ConfirmDocumentDeleteScreen(Screen[None]):
+    """Screen for confirming document deletion."""
+
+    doc_ids: list[str]
+    collection: CollectionInfo
+    parent_screen: "DocumentManagementScreen"
+
+    BINDINGS: list[Binding] = [
+        Binding("escape", "app.pop_screen", "Cancel"),
+        Binding("y", "confirm_delete", "Yes"),
+        Binding("n", "app.pop_screen", "No"),
+        Binding("enter", "confirm_delete", "Confirm"),
+    ]
+
+    def __init__(
+        self,
+        doc_ids: list[str],
+        collection: CollectionInfo,
+        parent_screen: "DocumentManagementScreen",
+    ):
+        super().__init__()
+        self.doc_ids = doc_ids
+        self.collection = collection
+        self.parent_screen = parent_screen
+
+    @override
+    def compose(self) -> ComposeResult:
+        yield Header()
+        yield Container(
+            Static("⚠️  Confirm Document Deletion", classes="title warning"),
+            Static(
+                f"Are you sure you want to delete {len(self.doc_ids)} documents from '{self.collection['name']}'?"
+            ),
+            Static("This action cannot be undone!", classes="warning"),
+            Static("Press Y to confirm, N or Escape to cancel", classes="subtitle"),
+            Horizontal(
+                Button("✅ Yes, Delete (Y)", id="yes_btn", variant="error"),
+                Button("❌ Cancel (N)", id="no_btn", variant="default"),
+                classes="action_buttons",
+            ),
+            LoadingIndicator(id="loading"),
+            classes="main_container center",
+        )
+        yield Footer()
+
+    def on_mount(self) -> None:
+        """Initialize the screen with focus on cancel button for safety."""
+        self.query_one("#loading").display = False
+        self.query_one("#no_btn").focus()
+
+    def on_button_pressed(self, event: Button.Pressed) -> None:
+        """Handle button presses."""
+        if event.button.id == "yes_btn":
+            self.action_confirm_delete()
+        elif event.button.id == "no_btn":
+            self.app.pop_screen()
+
+    def action_confirm_delete(self) -> None:
+        """Confirm deletion."""
+        self.run_worker(self.delete_documents())
+
+    async def delete_documents(self) -> None:
+        """Delete the selected documents."""
+        loading = self.query_one("#loading")
+        loading.display = True
+
+        try:
+            results: dict[str, bool] = {}
+            if hasattr(self.parent_screen, 'storage') and self.parent_screen.storage:
+                # Delete documents via storage
+                # The storage should have delete_documents method for weaviate
+                storage = self.parent_screen.storage
+                if hasattr(storage, 'delete_documents'):
+                    results = await storage.delete_documents(
+                        self.doc_ids,
+                        collection_name=self.collection["name"],
+                    )
+
+                # Count successful deletions
+                successful = sum(bool(success) for success in results.values())
+                failed = len(results) - successful
+
+                if successful > 0:
+                    self.notify(f"Deleted {successful} documents", severity="information")
+                if failed > 0:
+                    self.notify(f"Failed to delete {failed} documents", severity="error")
+
+                # Clear selection and refresh parent screen
+                self.parent_screen.selected_docs.clear()
+                await self.parent_screen.load_documents()
+                self.app.pop_screen()
+
+        except Exception as e:
+            self.notify(f"Failed to delete documents: {e}", severity="error", markup=False)
+        finally:
+            loading.display = False
+
+
+class LogViewerScreen(ModalScreen[None]):
+    """Display live log output without disrupting the TUI."""
+
+    _log_widget: RichLog | None
+    _log_file: Path | None
+
+    BINDINGS: list[Binding] = [
+        Binding("escape", "close", "Close"),
+        Binding("ctrl+l", "close", "Close"),
+        Binding("s", "show_path", "Log File"),
+    ]
+
+    def __init__(self) -> None:
+        super().__init__()
+        self._log_widget = None
+        self._log_file = None
+
+    @override
+    def compose(self) -> ComposeResult:
+        yield Header(show_clock=True)
+        yield Container(
+            Static("📜 Live Application Logs", classes="title"),
+            Static("Logs update in real time. Press S to reveal the log file path.", classes="subtitle"),
+            RichLog(id="log_stream", classes="log-stream", wrap=True, highlight=False),
+            Static("", id="log_file_path", classes="subtitle"),
+            classes="main_container log-viewer-container",
+        )
+        yield Footer()
+
+    def on_mount(self) -> None:
+        """Attach this viewer to the parent application once mounted."""
+        self._log_widget = self.query_one(RichLog)
+
+        if hasattr(self.app, 'attach_log_viewer'):
+            self.app.attach_log_viewer(self)
+
+    def on_unmount(self) -> None:
+        """Detach from the parent application when closed."""
+
+        if hasattr(self.app, 'detach_log_viewer'):
+            self.app.detach_log_viewer(self)
+
+    def _get_log_widget(self) -> RichLog:
+        if self._log_widget is None:
+            self._log_widget = self.query_one(RichLog)
+        if self._log_widget is None:
+            raise RuntimeError("RichLog widget not found")
+        return self._log_widget
+
+    def replace_logs(self, lines: list[str]) -> None:
+        """Replace rendered logs with the provided history."""
+        log_widget = self._get_log_widget()
+        log_widget.clear()
+        for line in lines:
+            log_widget.write(line)
+        log_widget.scroll_end(animate=False)
+
+    def append_logs(self, lines: list[str]) -> None:
+        """Append new log lines to the viewer."""
+        log_widget = self._get_log_widget()
+        for line in lines:
+            log_widget.write(line)
+        log_widget.scroll_end(animate=False)
+
+    def update_log_file(self, log_file: Path | None) -> None:
+        """Update the displayed log file path."""
+        self._log_file = log_file
+        label = self.query_one("#log_file_path", Static)
+        if log_file is None:
+            label.update("Logs are not currently being persisted to disk.")
+        else:
+            label.update(f"Log file: {log_file}")
+
+    def action_close(self) -> None:
+        """Close the log viewer."""
+        self.app.pop_screen()
+
+    def action_show_path(self) -> None:
+        """Reveal the log file location in a notification."""
+        if self._log_file is None:
+            self.notify("File logging is disabled for this session.", severity="warning")
+        else:
+            self.notify(f"Log file available at: {self._log_file}", severity="information", markup=False)
+</file>
+
+<file path="ingest_pipeline/config/settings.py">
+"""Application settings and configuration."""
+
+from functools import lru_cache
+from typing import Annotated, ClassVar, Literal
+
+from prefect.variables import Variable
+from pydantic import Field, HttpUrl, model_validator
+from pydantic_settings import BaseSettings, SettingsConfigDict
+
+
+class Settings(BaseSettings):
+    """Application settings."""
+
+    model_config: ClassVar[SettingsConfigDict] = SettingsConfigDict(
+        env_file=".env",
+        env_file_encoding="utf-8",
+        case_sensitive=False,
+        extra="ignore",  # Ignore extra environment variables
+    )
+
+    # API Keys
+    firecrawl_api_key: str | None = None
+    openwebui_api_key: str | None = None
+    weaviate_api_key: str | None = None
+    r2r_api_key: str | None = None
+
+    # Endpoints
+    llm_endpoint: HttpUrl = HttpUrl("http://llm.lab")
+    weaviate_endpoint: HttpUrl = HttpUrl("http://weaviate.yo")
+    openwebui_endpoint: HttpUrl = HttpUrl("http://chat.lab")  # This will be the API URL
+    firecrawl_endpoint: HttpUrl = HttpUrl("http://crawl.lab:30002")
+    r2r_endpoint: HttpUrl | None = Field(default=None, alias="r2r_api_url")
+
+    # Model Configuration
+    embedding_model: str = "ollama/bge-m3:latest"
+    embedding_dimension: int = 1024
+
+    # Ingestion Settings
+    default_batch_size: Annotated[int, Field(gt=0, le=500)] = 50
+    max_file_size: int = 1_000_000
+    max_crawl_depth: Annotated[int, Field(ge=1, le=20)] = 5
+    max_crawl_pages: Annotated[int, Field(ge=1, le=1000)] = 100
+
+    # Storage Settings
+    default_storage_backend: Literal["weaviate", "open_webui", "r2r"] = "weaviate"
+    default_collection_prefix: str = "docs"
+
+    # Prefect Settings
+    prefect_api_url: HttpUrl | None = None
+    prefect_api_key: str | None = None
+    prefect_work_pool: str = "default"
+
+    # Scheduling Defaults
+    default_schedule_interval: Annotated[int, Field(ge=1, le=10080)] = 60  # Max 1 week
+
+    # Performance Settings
+    max_concurrent_tasks: Annotated[int, Field(ge=1, le=20)] = 5
+    request_timeout: Annotated[int, Field(ge=10, le=300)] = 60
+
+    # Logging
+    log_level: Literal["DEBUG", "INFO", "WARNING", "ERROR"] = "INFO"
+
+    def get_storage_endpoint(self, backend: str) -> HttpUrl:
+        """
+        Get endpoint for storage backend.
+
+        Args:
+            backend: Storage backend name
+
+        Returns:
+            Endpoint URL
+
+        Raises:
+            ValueError: If backend is unknown or R2R endpoint not configured
+        """
+        endpoints = {
+            "weaviate": self.weaviate_endpoint,
+            "open_webui": self.openwebui_endpoint,
+        }
+
+        if backend in endpoints:
+            return endpoints[backend]
+        elif backend == "r2r":
+            if not self.r2r_endpoint:
+                raise ValueError(
+                    "R2R_API_URL must be set in environment variables. "
+                    "This should have been caught during settings validation."
+                )
+            return self.r2r_endpoint
+        else:
+            raise ValueError(f"Unknown backend: {backend}. Supported: weaviate, open_webui, r2r")
+
+    def get_api_key(self, service: str) -> str | None:
+        """
+        Get API key for service.
+
+        Args:
+            service: Service name
+
+        Returns:
+            API key or None
+        """
+        service_map = {
+            "firecrawl": self.firecrawl_api_key,
+            "openwebui": self.openwebui_api_key,
+            "weaviate": self.weaviate_api_key,
+            "r2r": self.r2r_api_key,
+        }
+        return service_map.get(service)
+
+    @model_validator(mode="after")
+    def validate_backend_configuration(self) -> "Settings":
+        """Validate that required configuration is present for the default backend."""
+        backend = self.default_storage_backend
+
+        # Validate R2R backend configuration
+        if backend == "r2r" and not self.r2r_endpoint:
+            raise ValueError(
+                "R2R_API_URL must be set in environment variables when using R2R as default backend"
+            )
+
+        # Validate API key requirements (optional warning for missing keys)
+        required_keys = {
+            "weaviate": ("WEAVIATE_API_KEY", self.weaviate_api_key),
+            "open_webui": ("OPENWEBUI_API_KEY", self.openwebui_api_key),
+            "r2r": ("R2R_API_KEY", self.r2r_api_key),
+        }
+
+        if backend in required_keys:
+            key_name, key_value = required_keys[backend]
+            if not key_value:
+                import warnings
+                warnings.warn(
+                    f"{key_name} not set - authentication may fail for {backend} backend",
+                    UserWarning,
+                    stacklevel=2
+                )
+
+        return self
+
+
+@lru_cache
+def get_settings() -> Settings:
+    """
+    Get cached settings instance.
+
+    Returns:
+        Settings instance
+    """
+    return Settings()
+
+
+class PrefectVariableConfig:
+    """Helper class for managing Prefect variables with fallbacks to settings."""
+
+    def __init__(self) -> None:
+        self._settings: Settings = get_settings()
+        self._variable_names: list[str] = [
+            "default_batch_size", "max_file_size", "max_crawl_depth", "max_crawl_pages",
+            "default_storage_backend", "default_collection_prefix", "max_concurrent_tasks",
+            "request_timeout", "default_schedule_interval"
+        ]
+
+    def _get_fallback_value(self, name: str, default_value: object = None) -> object:
+        """Get fallback value from settings or default."""
+        return default_value or getattr(self._settings, name, default_value)
+
+    def get_with_fallback(self, name: str, default_value: str | int | float | None = None) -> str | int | float | None:
+        """Get variable value with fallback synchronously."""
+        fallback = self._get_fallback_value(name, default_value)
+        # Ensure fallback is a type that Variable expects
+        variable_fallback = str(fallback) if fallback is not None else None
+        try:
+            result = Variable.get(name, default=variable_fallback)
+            # Variable can return various types, convert to our expected types
+            if isinstance(result, (str, int, float)):
+                return result
+            elif result is None:
+                return None
+            else:
+                # Convert other types to string
+                return str(result)
+        except Exception:
+            # Return fallback with proper type
+            if isinstance(fallback, (str, int, float)) or fallback is None:
+                return fallback
+            return str(fallback) if fallback is not None else None
+
+    async def get_with_fallback_async(self, name: str, default_value: str | int | float | None = None) -> str | int | float | None:
+        """Get variable value with fallback asynchronously."""
+        fallback = self._get_fallback_value(name, default_value)
+        variable_fallback = str(fallback) if fallback is not None else None
+        try:
+            result = await Variable.aget(name, default=variable_fallback)
+            # Variable can return various types, convert to our expected types
+            if isinstance(result, (str, int, float)):
+                return result
+            elif result is None:
+                return None
+            else:
+                # Convert other types to string
+                return str(result)
+        except Exception:
+            # Return fallback with proper type
+            if isinstance(fallback, (str, int, float)) or fallback is None:
+                return fallback
+            return str(fallback) if fallback is not None else None
+
+    def get_ingestion_config(self) -> dict[str, str | int | float | None]:
+        """Get all ingestion-related configuration variables synchronously."""
+        return {name: self.get_with_fallback(name) for name in self._variable_names}
+
+    async def get_ingestion_config_async(self) -> dict[str, str | int | float | None]:
+        """Get all ingestion-related configuration variables asynchronously."""
+        result: dict[str, str | int | float | None] = {}
+        for name in self._variable_names:
+            result[name] = await self.get_with_fallback_async(name)
+        return result
+
+
+@lru_cache
+def get_prefect_config() -> PrefectVariableConfig:
+    """Get cached Prefect variable configuration helper."""
+    return PrefectVariableConfig()
+</file>
+
+<file path="ingest_pipeline/core/models.py">
+"""Core data models with strict typing."""
+
+from datetime import UTC, datetime
+from enum import Enum
+from typing import Annotated, ClassVar, TypedDict
+from uuid import UUID, uuid4
+
+from prefect.blocks.core import Block
+from pydantic import BaseModel, Field, HttpUrl, SecretStr
+
+
+class IngestionStatus(str, Enum):
+    """Status of an ingestion job."""
+
+    PENDING = "pending"
+    IN_PROGRESS = "in_progress"
+    COMPLETED = "completed"
+    PARTIAL = "partial"  # Some documents succeeded, some failed
+    FAILED = "failed"
+    CANCELLED = "cancelled"
+
+
+class StorageBackend(str, Enum):
+    """Available storage backends."""
+
+    WEAVIATE = "weaviate"
+    OPEN_WEBUI = "open_webui"
+    R2R = "r2r"
+
+
+class IngestionSource(str, Enum):
+    """Types of ingestion sources."""
+
+    WEB = "web"
+    REPOSITORY = "repository"
+    DOCUMENTATION = "documentation"
+
+
+class VectorConfig(BaseModel):
+    """Configuration for vectorization."""
+
+    model: str = Field(default="ollama/bge-m3:latest")
+    embedding_endpoint: HttpUrl = Field(default=HttpUrl("http://llm.lab"))
+    dimension: int = Field(default=1024)
+    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
+
+
+class StorageConfig(Block):
+    """Configuration for storage backend."""
+
+    _block_type_name: ClassVar[str] = "Storage Configuration"
+    _block_type_slug: ClassVar[str] = "storage-config"
+    _description: ClassVar[str] = "Configures storage backend connections and settings for document ingestion"
+
+    backend: StorageBackend
+    endpoint: HttpUrl
+    api_key: SecretStr | None = Field(default=None)
+    collection_name: str = Field(default="documents")
+    batch_size: Annotated[int, Field(gt=0, le=1000)] = 100
+
+
+class FirecrawlConfig(Block):
+    """Configuration for Firecrawl ingestion (operational parameters only)."""
+
+    _block_type_name: ClassVar[str] = "Firecrawl Configuration"
+    _block_type_slug: ClassVar[str] = "firecrawl-config"
+    _description: ClassVar[str] = "Configures Firecrawl web scraping and crawling parameters"
+
+    formats: list[str] = Field(default_factory=lambda: ["markdown", "html"])
+    max_depth: Annotated[int, Field(ge=1, le=20)] = 5
+    limit: Annotated[int, Field(ge=1, le=1000)] = 100
+    only_main_content: bool = Field(default=True)
+    include_subdomains: bool = Field(default=False)
+
+
+class RepomixConfig(Block):
+    """Configuration for Repomix ingestion."""
+
+    _block_type_name: ClassVar[str] = "Repomix Configuration"
+    _block_type_slug: ClassVar[str] = "repomix-config"
+    _description: ClassVar[str] = "Configures repository ingestion patterns and file processing settings"
+
+    include_patterns: list[str] = Field(
+        default_factory=lambda: ["*.py", "*.js", "*.ts", "*.md", "*.yaml", "*.json"]
+    )
+    exclude_patterns: list[str] = Field(
+        default_factory=lambda: ["**/node_modules/**", "**/__pycache__/**", "**/.git/**"]
+    )
+    max_file_size: int = Field(default=1_000_000)  # 1MB
+    respect_gitignore: bool = Field(default=True)
+
+
+class R2RConfig(Block):
+    """Configuration for R2R ingestion."""
+
+    _block_type_name: ClassVar[str] = "R2R Configuration"
+    _block_type_slug: ClassVar[str] = "r2r-config"
+    _description: ClassVar[str] = "Configures R2R-specific ingestion settings including chunking and graph enrichment"
+
+    chunk_size: Annotated[int, Field(ge=100, le=8192)] = 1000
+    chunk_overlap: Annotated[int, Field(ge=0, le=1000)] = 200
+    enable_graph_enrichment: bool = Field(default=False)
+    graph_creation_settings: dict[str, object] | None = Field(default=None)
+
+
+class DocumentMetadataRequired(TypedDict):
+    """Required metadata fields for a document."""
+    source_url: str
+    timestamp: datetime
+    content_type: str
+    word_count: int
+    char_count: int
+
+
+class DocumentMetadata(DocumentMetadataRequired, total=False):
+    """Rich metadata for a document with R2R-compatible fields."""
+
+    # Basic optional fields
+    title: str | None
+    description: str | None
+
+    # Content categorization
+    tags: list[str]
+    category: str
+    section: str
+    language: str
+
+    # Authorship and source info
+    author: str
+    domain: str
+    site_name: str
+
+    # Document structure
+    heading_hierarchy: list[str]
+    section_depth: int
+    has_code_blocks: bool
+    has_images: bool
+    has_links: bool
+
+    # Processing metadata
+    extraction_method: str
+    crawl_depth: int
+    last_modified: datetime | None
+
+    # Content quality indicators
+    readability_score: float | None
+    completeness_score: float | None
+
+    # Repository-specific fields
+    file_path: str | None
+    repository_name: str | None
+    branch_name: str | None
+    commit_hash: str | None
+    programming_language: str | None
+
+    # Custom business metadata
+    importance_score: float | None
+    review_status: str | None
+    assigned_team: str | None
+
+
+class Document(BaseModel):
+    """Represents a single document."""
+
+    id: UUID = Field(default_factory=uuid4)
+    content: str
+    metadata: DocumentMetadata
+    vector: list[float] | None = Field(default=None)
+    score: float | None = Field(default=None)
+    source: IngestionSource
+    collection: str = Field(default="documents")
+
+
+class IngestionJob(BaseModel):
+    """Represents an ingestion job."""
+
+    id: UUID = Field(default_factory=uuid4)
+    source_type: IngestionSource
+    source_url: HttpUrl | str
+    status: IngestionStatus = Field(default=IngestionStatus.PENDING)
+    created_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
+    updated_at: datetime = Field(default_factory=lambda: datetime.now(UTC))
+    completed_at: datetime | None = Field(default=None)
+    error_message: str | None = Field(default=None)
+    document_count: int = Field(default=0)
+    storage_backend: StorageBackend
+
+
+class IngestionResult(BaseModel):
+    """Result of an ingestion operation."""
+
+    job_id: UUID
+    status: IngestionStatus
+    documents_processed: int
+    documents_failed: int
+    duration_seconds: float
+    error_messages: list[str] = Field(default_factory=list)
+</file>
+
+<file path="ingest_pipeline/flows/ingestion.py">
+"""Prefect flow for ingestion pipeline."""
+
+from __future__ import annotations
+
+from collections.abc import Callable
+from datetime import UTC, datetime
+from typing import TYPE_CHECKING, Literal, TypeAlias, assert_never, cast
+
+from prefect import flow, get_run_logger, task
+from prefect.blocks.core import Block
+from prefect.variables import Variable
+from pydantic import SecretStr
+
+from ..config.settings import Settings
+from ..core.exceptions import IngestionError
+from ..core.models import (
+    Document,
+    FirecrawlConfig,
+    IngestionJob,
+    IngestionResult,
+    IngestionSource,
+    IngestionStatus,
+    RepomixConfig,
+    StorageBackend,
+    StorageConfig,
+)
+from ..ingestors import BaseIngestor, FirecrawlIngestor, FirecrawlPage, RepomixIngestor
+from ..storage import OpenWebUIStorage, WeaviateStorage
+from ..storage import R2RStorage as RuntimeR2RStorage
+from ..storage.base import BaseStorage
+from ..utils.metadata_tagger import MetadataTagger
+
+SourceTypeLiteral = Literal["web", "repository", "documentation"]
+StorageBackendLiteral = Literal["weaviate", "open_webui", "r2r"]
+SourceTypeLike: TypeAlias = IngestionSource | SourceTypeLiteral
+StorageBackendLike: TypeAlias = StorageBackend | StorageBackendLiteral
+
+
+def _safe_cache_key(prefix: str, params: dict[str, object], key: str) -> str:
+    """Create a type-safe cache key from task parameters."""
+    value = params.get(key, "")
+    return f"{prefix}_{hash(str(value))}"
+
+
+if TYPE_CHECKING:
+    from ..storage.r2r.storage import R2RStorage as R2RStorageType
+else:
+    R2RStorageType = BaseStorage
+
+
+@task(name="validate_source", retries=2, retry_delay_seconds=10, tags=["validation"])
+async def validate_source_task(source_url: str, source_type: IngestionSource) -> bool:
+    """
+    Validate that a source is accessible.
+
+    Args:
+        source_url: URL or path to source
+        source_type: Type of source
+
+    Returns:
+        True if valid
+    """
+    if source_type == IngestionSource.WEB:
+        ingestor = FirecrawlIngestor()
+    elif source_type == IngestionSource.REPOSITORY:
+        ingestor = RepomixIngestor()
+    else:
+        raise ValueError(f"Unsupported source type: {source_type}")
+
+    result = await ingestor.validate_source(source_url)
+    return bool(result)
+
+
+@task(name="initialize_storage", retries=3, retry_delay_seconds=5, tags=["storage"])
+async def initialize_storage_task(config: StorageConfig | str) -> BaseStorage:
+    """
+    Initialize storage backend.
+
+    Args:
+        config: Storage configuration block or block name
+
+    Returns:
+        Initialized storage adapter
+    """
+    # Load block if string provided
+    if isinstance(config, str):
+        # Use Block.aload with type slug for better type inference
+        loaded_block = await Block.aload(f"storage-config/{config}")
+        config = cast(StorageConfig, loaded_block)
+
+    if config.backend == StorageBackend.WEAVIATE:
+        storage = WeaviateStorage(config)
+    elif config.backend == StorageBackend.OPEN_WEBUI:
+        storage = OpenWebUIStorage(config)
+    elif config.backend == StorageBackend.R2R:
+        if RuntimeR2RStorage is None:
+            raise ValueError("R2R storage not available. Check dependencies.")
+        storage = RuntimeR2RStorage(config)
+    else:
+        raise ValueError(f"Unsupported backend: {config.backend}")
+
+    await storage.initialize()
+    return storage
+
+
+@task(name="map_firecrawl_site", retries=2, retry_delay_seconds=15, tags=["firecrawl", "map"],
+      cache_key_fn=lambda ctx, p: _safe_cache_key("firecrawl_map", p, "source_url"))
+async def map_firecrawl_site_task(source_url: str, config: FirecrawlConfig | str) -> list[str]:
+    """Map a site using Firecrawl and return discovered URLs."""
+    # Load block if string provided
+    if isinstance(config, str):
+        # Use Block.aload with type slug for better type inference
+        loaded_block = await Block.aload(f"firecrawl-config/{config}")
+        config = cast(FirecrawlConfig, loaded_block)
+
+    ingestor = FirecrawlIngestor(config)
+    mapped = await ingestor.map_site(source_url)
+    return mapped or [source_url]
+
+
+@task(name="filter_existing_documents", retries=1, retry_delay_seconds=5, tags=["dedup"],
+      cache_key_fn=lambda ctx, p: _safe_cache_key("filter_docs", p, "urls"))  # Cache based on URL list
+async def filter_existing_documents_task(
+    urls: list[str],
+    storage_client: BaseStorage,
+    stale_after_days: int = 30,
+    *,
+    collection_name: str | None = None,
+) -> list[str]:
+    """Filter URLs to only those that need scraping (missing or stale in storage)."""
+    logger = get_run_logger()
+    eligible: list[str] = []
+
+    for url in urls:
+        document_id = str(FirecrawlIngestor.compute_document_id(url))
+        exists = await storage_client.check_exists(
+            document_id,
+            collection_name=collection_name,
+            stale_after_days=stale_after_days
+        )
+
+        if not exists:
+            eligible.append(url)
+
+    skipped = len(urls) - len(eligible)
+    if skipped > 0:
+        logger.info("Skipping %s up-to-date documents in %s", skipped, storage_client.display_name)
+
+    return eligible
+
+
+@task(
+    name="scrape_firecrawl_batch", retries=2, retry_delay_seconds=20, tags=["firecrawl", "scrape"]
+)
+async def scrape_firecrawl_batch_task(
+    batch_urls: list[str], config: FirecrawlConfig
+) -> list[FirecrawlPage]:
+    """Scrape a batch of URLs via Firecrawl."""
+    ingestor = FirecrawlIngestor(config)
+    result: list[FirecrawlPage] = await ingestor.scrape_pages(batch_urls)
+    return result
+
+
+@task(name="annotate_firecrawl_metadata", retries=1, retry_delay_seconds=10, tags=["metadata"])
+async def annotate_firecrawl_metadata_task(
+    pages: list[FirecrawlPage], job: IngestionJob
+) -> list[Document]:
+    """Annotate scraped pages with standardized metadata."""
+    if not pages:
+        return []
+
+    ingestor = FirecrawlIngestor()
+    documents = [ingestor.create_document(page, job) for page in pages]
+
+    try:
+        from ..config import get_settings
+
+        settings = get_settings()
+        async with MetadataTagger(llm_endpoint=str(settings.llm_endpoint)) as tagger:
+            tagged_documents: list[Document] = await tagger.tag_batch(documents)
+            return tagged_documents
+    except IngestionError as exc:  # pragma: no cover - logging side effect
+        logger = get_run_logger()
+        logger.warning("Metadata tagging failed: %s", exc)
+        return documents
+    except Exception as exc:  # pragma: no cover - defensive
+        logger = get_run_logger()
+        logger.warning("Metadata tagging unavailable, using base metadata: %s", exc)
+        return documents
+
+
+@task(name="upsert_r2r_documents", retries=2, retry_delay_seconds=20, tags=["storage", "r2r"])
+async def upsert_r2r_documents_task(
+    storage_client: R2RStorageType,
+    documents: list[Document],
+    collection_name: str | None,
+) -> tuple[int, int]:
+    """Upsert documents into R2R storage."""
+    if not documents:
+        return 0, 0
+
+    stored_ids: list[str] = await storage_client.store_batch(
+        documents, collection_name=collection_name
+    )
+    processed = len(stored_ids)
+    failed = len(documents) - processed
+
+    if failed:
+        logger = get_run_logger()
+        logger.warning("Failed to upsert %s documents to R2R", failed)
+
+    return processed, failed
+
+
+@task(name="ingest_documents", retries=2, retry_delay_seconds=30, tags=["ingestion"])
+async def ingest_documents_task(
+    job: IngestionJob,
+    collection_name: str | None = None,
+    batch_size: int | None = None,
+    storage_client: BaseStorage | None = None,
+    storage_block_name: str | None = None,
+    ingestor_config_block_name: str | None = None,
+    progress_callback: Callable[[int, str], None] | None = None,
+) -> tuple[int, int]:
+    """
+    Ingest documents from source with optional pre-initialized storage client.
+
+    Args:
+        job: Ingestion job configuration
+        collection_name: Target collection name
+        batch_size: Number of documents per batch (uses Variable if None)
+        storage_client: Optional pre-initialized storage client
+        storage_block_name: Optional storage block name to load
+        ingestor_config_block_name: Optional ingestor config block name to load
+        progress_callback: Optional callback for progress updates
+
+    Returns:
+        Tuple of (processed_count, failed_count)
+    """
+    if progress_callback:
+        progress_callback(35, "Creating ingestor and storage clients...")
+
+    # Use Variable for batch size if not provided
+    if batch_size is None:
+        try:
+            batch_size_var = await Variable.aget("default_batch_size", default="50")
+            # Convert Variable result to int, handling various types
+            if isinstance(batch_size_var, int):
+                batch_size = batch_size_var
+            elif isinstance(batch_size_var, (str, float)):
+                batch_size = int(float(str(batch_size_var)))
+            else:
+                batch_size = 50
+        except Exception:
+            batch_size = 50
+
+    ingestor = await _create_ingestor(job, ingestor_config_block_name)
+    storage = storage_client or await _create_storage(job, collection_name, storage_block_name)
+
+    if progress_callback:
+        progress_callback(40, "Starting document processing...")
+
+    return await _process_documents(ingestor, storage, job, batch_size, collection_name, progress_callback)
+
+
+async def _create_ingestor(job: IngestionJob, config_block_name: str | None = None) -> BaseIngestor:
+    """Create appropriate ingestor based on job source type."""
+    if job.source_type == IngestionSource.WEB:
+        if config_block_name:
+            # Use Block.aload with type slug for better type inference
+            loaded_block = await Block.aload(f"firecrawl-config/{config_block_name}")
+            config = cast(FirecrawlConfig, loaded_block)
+        else:
+            # Fallback to default configuration
+            config = FirecrawlConfig()
+        return FirecrawlIngestor(config)
+    elif job.source_type == IngestionSource.REPOSITORY:
+        if config_block_name:
+            # Use Block.aload with type slug for better type inference
+            loaded_block = await Block.aload(f"repomix-config/{config_block_name}")
+            config = cast(RepomixConfig, loaded_block)
+        else:
+            # Fallback to default configuration
+            config = RepomixConfig()
+        return RepomixIngestor(config)
+    else:
+        raise ValueError(f"Unsupported source: {job.source_type}")
+
+
+async def _create_storage(job: IngestionJob, collection_name: str | None, storage_block_name: str | None = None) -> BaseStorage:
+    """Create and initialize storage client."""
+    if collection_name is None:
+        # Use variable for default collection prefix
+        prefix = await Variable.aget("default_collection_prefix", default="docs")
+        collection_name = f"{prefix}_{job.source_type.value}"
+
+    if storage_block_name:
+        # Load storage config from block
+        loaded_block = await Block.aload(f"storage-config/{storage_block_name}")
+        storage_config = cast(StorageConfig, loaded_block)
+        # Override collection name if provided
+        storage_config.collection_name = collection_name
+    else:
+        # Fallback to building config from settings
+        from ..config import get_settings
+        settings = get_settings()
+        storage_config = _build_storage_config(job, settings, collection_name)
+
+    storage = _instantiate_storage(job.storage_backend, storage_config)
+    await storage.initialize()
+    return storage
+
+
+def _build_storage_config(
+    job: IngestionJob, settings: Settings, collection_name: str
+) -> StorageConfig:
+    """Build storage configuration from job and settings."""
+    storage_endpoints = {
+        StorageBackend.WEAVIATE: settings.weaviate_endpoint,
+        StorageBackend.OPEN_WEBUI: settings.openwebui_endpoint,
+        StorageBackend.R2R: settings.get_storage_endpoint("r2r"),
+    }
+    storage_api_keys: dict[StorageBackend, str | None] = {
+        StorageBackend.WEAVIATE: settings.get_api_key("weaviate"),
+        StorageBackend.OPEN_WEBUI: settings.get_api_key("openwebui"),
+        StorageBackend.R2R: None,  # R2R is self-hosted, no API key needed
+    }
+
+    api_key_raw: str | None = storage_api_keys[job.storage_backend]
+    api_key: SecretStr | None = SecretStr(api_key_raw) if api_key_raw is not None else None
+
+    return StorageConfig(
+        backend=job.storage_backend,
+        endpoint=storage_endpoints[job.storage_backend],
+        api_key=api_key,
+        collection_name=collection_name,
+    )
+
+
+def _instantiate_storage(backend: StorageBackend, config: StorageConfig) -> BaseStorage:
+    """Instantiate storage based on backend type."""
+    if backend == StorageBackend.WEAVIATE:
+        return WeaviateStorage(config)
+    elif backend == StorageBackend.OPEN_WEBUI:
+        return OpenWebUIStorage(config)
+    elif backend == StorageBackend.R2R:
+        if RuntimeR2RStorage is None:
+            raise ValueError("R2R storage not available. Check dependencies.")
+        return RuntimeR2RStorage(config)
+
+    assert_never(backend)
+
+
+def _chunk_urls(urls: list[str], chunk_size: int) -> list[list[str]]:
+    """Group URLs into fixed-size chunks for batch processing."""
+
+    if chunk_size <= 0:
+        raise ValueError("chunk_size must be greater than zero")
+
+    return [urls[i : i + chunk_size] for i in range(0, len(urls), chunk_size)]
+
+
+def _deduplicate_urls(urls: list[str]) -> list[str]:
+    """Return the URLs with order preserved and duplicates removed."""
+
+    seen: set[str] = set()
+    unique: list[str] = []
+    for url in urls:
+        if url not in seen:
+            seen.add(url)
+            unique.append(url)
+    return unique
+
+
+async def _process_documents(
+    ingestor: BaseIngestor,
+    storage: BaseStorage,
+    job: IngestionJob,
+    batch_size: int,
+    collection_name: str | None,
+    progress_callback: Callable[[int, str], None] | None = None,
+) -> tuple[int, int]:
+    """Process documents in batches."""
+    processed = 0
+    failed = 0
+    batch: list[Document] = []
+    total_documents = 0
+    batch_count = 0
+
+    if progress_callback:
+        progress_callback(45, "Ingesting documents from source...")
+
+    # Use smart ingestion with deduplication if storage supports it
+    if hasattr(storage, 'check_exists'):
+        try:
+            # Try to use the smart ingestion method
+            document_generator = ingestor.ingest_with_dedup(
+                job, storage, collection_name=collection_name
+            )
+        except Exception:
+            # Fall back to regular ingestion if smart method fails
+            document_generator = ingestor.ingest(job)
+    else:
+        document_generator = ingestor.ingest(job)
+
+    async for document in document_generator:
+        batch.append(document)
+        total_documents += 1
+
+        if len(batch) >= batch_size:
+            batch_count += 1
+            if progress_callback:
+                progress_callback(
+                    45 + min(35, (batch_count * 10)),
+                    f"Processing batch {batch_count} ({total_documents} documents so far)..."
+                )
+
+            batch_processed, batch_failed = await _store_batch(storage, batch, collection_name)
+            processed += batch_processed
+            failed += batch_failed
+            batch = []
+
+    # Process remaining batch
+    if batch:
+        batch_count += 1
+        if progress_callback:
+            progress_callback(80, f"Processing final batch ({total_documents} total documents)...")
+
+        batch_processed, batch_failed = await _store_batch(storage, batch, collection_name)
+        processed += batch_processed
+        failed += batch_failed
+
+    if progress_callback:
+        progress_callback(85, f"Completed processing {total_documents} documents")
+
+    return processed, failed
+
+
+async def _store_batch(
+    storage: BaseStorage,
+    batch: list[Document],
+    collection_name: str | None,
+) -> tuple[int, int]:
+    """Store a batch of documents and return processed/failed counts."""
+    try:
+        # Apply metadata tagging for backends that benefit from it
+        processed_batch = batch
+        if hasattr(storage, "config") and storage.config.backend in (
+            StorageBackend.R2R,
+            StorageBackend.WEAVIATE,
+        ):
+            try:
+                from ..config import get_settings
+
+                settings = get_settings()
+                async with MetadataTagger(llm_endpoint=str(settings.llm_endpoint)) as tagger:
+                    processed_batch = await tagger.tag_batch(batch)
+            except Exception as exc:
+                print(f"Metadata tagging failed, using original documents: {exc}")
+                processed_batch = batch
+
+        stored_ids = await storage.store_batch(processed_batch, collection_name=collection_name)
+        processed_count = len(stored_ids)
+        failed_count = len(processed_batch) - processed_count
+
+        batch_type = (
+            "final" if len(processed_batch) < 50 else ""
+        )  # Assume standard batch size is 50
+        print(f"Successfully stored {processed_count} documents in {batch_type} batch".strip())
+
+        return processed_count, failed_count
+    except Exception as e:
+        batch_type = "Final" if len(batch) < 50 else "Batch"
+        print(f"{batch_type} storage failed: {e}")
+        return 0, len(batch)
+
+
+@flow(
+    name="firecrawl_to_r2r",
+    description="Ingest Firecrawl pages into R2R with metadata annotation",
+    persist_result=False,
+    log_prints=True,
+)
+async def firecrawl_to_r2r_flow(
+    job: IngestionJob, collection_name: str | None = None, progress_callback: Callable[[int, str], None] | None = None
+) -> tuple[int, int]:
+    """Specialized flow for Firecrawl ingestion into R2R."""
+    logger = get_run_logger()
+    from ..config import get_settings
+
+    if progress_callback:
+        progress_callback(35, "Initializing Firecrawl and R2R storage...")
+
+    settings = get_settings()
+    firecrawl_config = FirecrawlConfig()
+    resolved_collection = collection_name or f"docs_{job.source_type.value}"
+
+    storage_config = _build_storage_config(job, settings, resolved_collection)
+    storage_client = await initialize_storage_task(storage_config)
+
+    if RuntimeR2RStorage is None or not isinstance(storage_client, RuntimeR2RStorage):
+        raise IngestionError("Firecrawl to R2R flow requires an R2R storage backend")
+
+    r2r_storage = cast("R2RStorageType", storage_client)
+
+    if progress_callback:
+        progress_callback(45, "Checking for existing content before mapping...")
+
+    # Smart mapping: try single URL first to avoid expensive map operation
+    base_url = str(job.source_url)
+    single_url_id = str(FirecrawlIngestor.compute_document_id(base_url))
+    base_exists = await r2r_storage.check_exists(
+        single_url_id, collection_name=resolved_collection, stale_after_days=30
+    )
+
+    if base_exists:
+        # Check if this is a recent single-page update
+        logger.info("Base URL %s exists and is fresh, skipping expensive mapping", base_url)
+        if progress_callback:
+            progress_callback(100, "Content is up to date, no processing needed")
+        return 0, 0
+
+    if progress_callback:
+        progress_callback(50, "Discovering pages with Firecrawl...")
+
+    discovered_urls = await map_firecrawl_site_task(base_url, firecrawl_config)
+    unique_urls = _deduplicate_urls(discovered_urls)
+    logger.info("Discovered %s unique URLs from Firecrawl map", len(unique_urls))
+
+    if progress_callback:
+        progress_callback(60, f"Found {len(unique_urls)} pages, filtering existing content...")
+
+    eligible_urls = await filter_existing_documents_task(
+        unique_urls, r2r_storage, collection_name=resolved_collection
+    )
+
+    if not eligible_urls:
+        logger.info("All Firecrawl pages are up to date for %s", job.source_url)
+        if progress_callback:
+            progress_callback(100, "All pages are up to date, no processing needed")
+        return 0, 0
+
+    if progress_callback:
+        progress_callback(70, f"Scraping {len(eligible_urls)} new/updated pages...")
+
+    batch_size = min(settings.default_batch_size, firecrawl_config.limit)
+    url_batches = _chunk_urls(eligible_urls, batch_size)
+    logger.info("Scraping %s batches of Firecrawl pages", len(url_batches))
+
+    # Use asyncio.gather for concurrent scraping
+    import asyncio
+    scrape_tasks = [
+        scrape_firecrawl_batch_task(batch, firecrawl_config)
+        for batch in url_batches
+    ]
+    batch_results = await asyncio.gather(*scrape_tasks)
+
+    scraped_pages: list[FirecrawlPage] = []
+    for batch_pages in batch_results:
+        scraped_pages.extend(batch_pages)
+
+    if progress_callback:
+        progress_callback(80, f"Processing {len(scraped_pages)} scraped pages...")
+
+    documents = await annotate_firecrawl_metadata_task(scraped_pages, job)
+
+    if not documents:
+        logger.warning("No documents produced after scraping for %s", job.source_url)
+        return 0, len(eligible_urls)
+
+    if progress_callback:
+        progress_callback(90, f"Storing {len(documents)} documents in R2R...")
+
+    processed, failed = await upsert_r2r_documents_task(r2r_storage, documents, resolved_collection)
+
+    logger.info("Upserted %s documents into R2R (%s failed)", processed, failed)
+
+    return processed, failed
+
+
+@task(name="update_job_status", tags=["tracking"])
+async def update_job_status_task(
+    job: IngestionJob,
+    status: IngestionStatus,
+    processed: int = 0,
+    _failed: int = 0,
+    error: str | None = None,
+) -> IngestionJob:
+    """
+    Update job status.
+
+    Args:
+        job: Ingestion job
+        status: New status
+        processed: Documents processed
+        _failed: Documents failed (currently unused)
+        error: Error message if any
+
+    Returns:
+        Updated job
+    """
+    job.status = status
+    job.updated_at = datetime.now(UTC)
+    job.document_count = processed
+
+    if status == IngestionStatus.COMPLETED:
+        job.completed_at = datetime.now(UTC)
+
+    if error:
+        job.error_message = error
+
+    return job
+
+
+@flow(
+    name="ingestion_pipeline",
+    description="Main ingestion pipeline for documents",
+    retries=1,
+    retry_delay_seconds=60,
+    persist_result=True,
+    log_prints=True,
+)
+async def create_ingestion_flow(
+    source_url: str,
+    source_type: SourceTypeLike,
+    storage_backend: StorageBackendLike = StorageBackend.WEAVIATE,
+    collection_name: str | None = None,
+    validate_first: bool = True,
+    progress_callback: Callable[[int, str], None] | None = None,
+) -> IngestionResult:
+    """
+    Main ingestion flow.
+
+    Args:
+        source_url: URL or path to source
+        source_type: Type of source
+        storage_backend: Storage backend to use
+        validate_first: Whether to validate source first
+        progress_callback: Optional callback for progress updates
+
+    Returns:
+        Ingestion result
+    """
+    print(f"Starting ingestion from {source_url}")
+
+    source_enum = IngestionSource(source_type)
+    backend_enum = StorageBackend(storage_backend)
+
+    # Create job
+    job = IngestionJob(
+        source_url=source_url,
+        source_type=source_enum,
+        storage_backend=backend_enum,
+        status=IngestionStatus.PENDING,
+    )
+
+    start_time = datetime.now(UTC)
+    error_messages: list[str] = []
+    processed = 0
+    failed = 0
+
+    try:
+        # Validate source if requested
+        if validate_first:
+            if progress_callback:
+                progress_callback(10, "Validating source...")
+            print("Validating source...")
+            is_valid = await validate_source_task(source_url, job.source_type)
+
+            if not is_valid:
+                raise IngestionError(f"Source validation failed: {source_url}")
+
+        # Update status to in progress
+        if progress_callback:
+            progress_callback(20, "Initializing storage...")
+        job = await update_job_status_task(job, IngestionStatus.IN_PROGRESS)
+
+        # Run ingestion
+        if progress_callback:
+            progress_callback(30, "Starting document ingestion...")
+        print("Ingesting documents...")
+        if job.source_type == IngestionSource.WEB and job.storage_backend == StorageBackend.R2R:
+            processed, failed = await firecrawl_to_r2r_flow(job, collection_name, progress_callback=progress_callback)
+        else:
+            processed, failed = await ingest_documents_task(job, collection_name, progress_callback=progress_callback)
+
+        if progress_callback:
+            progress_callback(90, "Finalizing ingestion...")
+
+        # Update final status
+        if failed > 0:
+            error_messages.append(f"{failed} documents failed to process")
+
+        # Set status based on results
+        if processed == 0 and failed > 0:
+            final_status = IngestionStatus.FAILED
+        elif failed > 0:
+            final_status = IngestionStatus.PARTIAL
+        else:
+            final_status = IngestionStatus.COMPLETED
+
+        job = await update_job_status_task(job, final_status, processed=processed, _failed=failed)
+
+        print(f"Ingestion completed: {processed} processed, {failed} failed")
+
+    except Exception as e:
+        print(f"Ingestion failed: {e}")
+        error_messages.append(str(e))
+
+        # Don't reset counts - keep whatever was processed before the error
+        job = await update_job_status_task(
+            job, IngestionStatus.FAILED, processed=processed, _failed=failed, error=str(e)
+        )
+
+    # Calculate duration
+    duration = (datetime.now(UTC) - start_time).total_seconds()
+
+    return IngestionResult(
+        job_id=job.id,
+        status=job.status,
+        documents_processed=processed,
+        documents_failed=failed,
+        duration_seconds=duration,
+        error_messages=error_messages,
+    )
+</file>
+
+<file path="ingest_pipeline/storage/r2r/storage.py">
+"""R2R storage implementation using the official R2R SDK."""
+
+from __future__ import annotations
+
+import asyncio
+import contextlib
+from collections.abc import AsyncGenerator, Iterable, Mapping, Sequence
+from datetime import UTC, datetime
+from typing import Self, TypeVar, cast
+from uuid import UUID, uuid4
+
+# Direct imports for runtime and type checking
+# Note: Some type checkers (basedpyright/Pyrefly) may report import issues
+# but these work correctly at runtime and with mypy
+from httpx import AsyncClient, HTTPStatusError
+from r2r import R2RAsyncClient, R2RException
+from typing_extensions import override
+
+from ...core.exceptions import StorageError
+from ...core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
+from ..base import BaseStorage
+
+T = TypeVar("T")
+
+
+def _as_mapping(value: object) -> dict[str, object]:
+    if isinstance(value, Mapping):
+        return dict(cast(Mapping[str, object], value))
+    if hasattr(value, "__dict__"):
+        return dict(cast(Mapping[str, object], value.__dict__))
+    return {}
+
+
+def _as_sequence(value: object) -> tuple[object, ...]:
+    """Convert value to a tuple of objects."""
+    if isinstance(value, Sequence):
+        return tuple(value)
+    return tuple(value) if isinstance(value, Iterable) else ()
+
+
+def _extract_id(source: object, fallback: str) -> str:
+    mapping = _as_mapping(source)
+    identifier = mapping.get("id") if mapping else None
+    if identifier is None and hasattr(source, "id"):
+        identifier = getattr(source, "id", None)
+    return fallback if identifier is None else str(identifier)
+
+
+def _as_datetime(value: object) -> datetime:
+    if isinstance(value, datetime):
+        return value
+    if isinstance(value, str):
+        with contextlib.suppress(ValueError):
+            return datetime.fromisoformat(value)
+    return datetime.now(UTC)
+
+
+def _as_int(value: object, default: int = 0) -> int:
+    if isinstance(value, bool):
+        return int(value)
+    if isinstance(value, int):
+        return value
+    if isinstance(value, float):
+        return int(value)
+    if isinstance(value, str):
+        try:
+            return int(float(value)) if "." in value else int(value)
+        except ValueError:
+            return default
+    return default
+
+
+class R2RStorage(BaseStorage):
+    """R2R storage implementation using the official R2R SDK."""
+
+    def __init__(self, config: StorageConfig) -> None:
+        """Initialize R2R storage with SDK client."""
+        super().__init__(config)
+        self.endpoint: str = str(config.endpoint).rstrip("/")
+        self.client: R2RAsyncClient = R2RAsyncClient(self.endpoint)
+        self.default_collection_id: str | None = None
+
+    @override
+    async def initialize(self) -> None:
+        """Initialize R2R connection and ensure default collection exists."""
+        try:
+            # Ensure we have an event loop
+            try:
+                _ = asyncio.get_running_loop()
+            except RuntimeError:
+                # No event loop running, this should not happen in async context
+                # but let's be defensive
+                import logging
+
+                logging.warning("No event loop found during R2R initialization")
+
+            # Test connection using direct HTTP call to v3 API
+            endpoint = self.endpoint
+            client = AsyncClient()
+            try:
+                response = await client.get(f"{endpoint}/v3/collections")
+                response.raise_for_status()
+            finally:
+                await client.aclose()
+            _ = await self._ensure_collection(self.config.collection_name)
+        except Exception as e:
+            raise StorageError(f"Failed to initialize R2R: {e}") from e
+
+    async def _ensure_collection(self, collection_name: str) -> str:
+        """Get or create collection by name."""
+        endpoint = self.endpoint
+        client = AsyncClient()
+        try:
+            # List collections and find by name
+            response = await client.get(f"{endpoint}/v3/collections")
+            response.raise_for_status()
+            data: dict[str, object] = response.json()
+
+            results = cast(list[dict[str, object]], data.get("results", []))
+            for collection in results:
+                if collection.get("name") == collection_name:
+                    collection_id_raw = collection.get("id")
+                    if collection_id_raw is None:
+                        raise StorageError(f"Collection '{collection_name}' exists but has no ID")
+                    collection_id = str(collection_id_raw)
+                    if collection_name == self.config.collection_name:
+                        self.default_collection_id = collection_id
+                    return collection_id
+
+            # Create if not found
+            create_response = await client.post(
+                f"{endpoint}/v3/collections",
+                json={
+                    "name": collection_name,
+                    "description": f"Auto-created collection: {collection_name}",
+                },
+            )
+            create_response.raise_for_status()
+            created: dict[str, object] = create_response.json()
+            created_results = cast(dict[str, object], created.get("results", {}))
+            collection_id_raw = created_results.get("id")
+            if collection_id_raw is None:
+                raise StorageError("Failed to get collection ID from creation response")
+            collection_id = str(collection_id_raw)
+
+            if collection_name == self.config.collection_name:
+                self.default_collection_id = collection_id
+
+            return collection_id
+        except Exception as e:
+            raise StorageError(f"Failed to ensure collection '{collection_name}': {e}") from e
+        finally:
+            await client.aclose()
+
+    @override
+    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
+        """Store a single document."""
+        return (await self.store_batch([document], collection_name=collection_name))[0]
+
+    @override
+    async def store_batch(
+        self, documents: list[Document], *, collection_name: str | None = None
+    ) -> list[str]:
+        """Store multiple documents."""
+        collection_id = await self._resolve_collection_id(collection_name)
+        print(
+            f"Using collection ID: {collection_id} for collection: {collection_name or self.config.collection_name}"
+        )
+
+        stored_ids: list[str] = []
+        for document in documents:
+            if not self._is_document_valid(document):
+                continue
+
+            stored_id = await self._store_single_document(document, collection_id)
+            if stored_id:
+                stored_ids.append(stored_id)
+
+        return stored_ids
+
+    async def _resolve_collection_id(self, collection_name: str | None) -> str:
+        """Resolve collection ID from name or use default."""
+        if collection_name:
+            return await self._ensure_collection(collection_name)
+
+        if self.default_collection_id:
+            return self.default_collection_id
+
+        collection_id = await self._ensure_collection(self.config.collection_name)
+        self.default_collection_id = collection_id
+        return collection_id
+
+    def _is_document_valid(self, document: Document) -> bool:
+        """Validate document content and size."""
+        requested_id = str(document.id)
+
+        if not document.content or not document.content.strip():
+            print(f"Skipping document {requested_id}: empty content")
+            return False
+
+        if len(document.content) > 1_000_000:  # 1MB limit
+            print(
+                f"Skipping document {requested_id}: content too large ({len(document.content)} chars)"
+            )
+            return False
+
+        return True
+
+    async def _store_single_document(self, document: Document, collection_id: str) -> str | None:
+        """Store a single document with retry logic."""
+        requested_id = str(document.id)
+        print(f"Creating document with ID: {requested_id}")
+
+        max_retries = 3
+        retry_delay = 1.0
+
+        for attempt in range(max_retries):
+            try:
+                doc_response = await self._attempt_document_creation(document, collection_id)
+                if doc_response:
+                    return self._process_document_response(doc_response, requested_id, collection_id)
+            except (TimeoutError, OSError) as e:
+                if not await self._should_retry_timeout(e, attempt, max_retries, requested_id, retry_delay):
+                    break
+                retry_delay *= 2
+            except HTTPStatusError as e:
+                if not await self._should_retry_http_error(e, attempt, max_retries, requested_id, retry_delay):
+                    break
+                retry_delay *= 2
+            except Exception as exc:
+                self._log_document_error(document.id, exc)
+                break
+
+        return None
+
+    async def _attempt_document_creation(self, document: Document, collection_id: str) -> dict[str, object] | None:
+        """Attempt to create a document via HTTP API."""
+        import json
+
+        requested_id = str(document.id)
+        metadata = self._build_metadata(document)
+        print(f"Built metadata for document {requested_id}: {metadata}")
+
+        files = {
+            "raw_text": (None, document.content),
+            "metadata": (None, json.dumps(metadata)),
+            "id": (None, requested_id),
+            "ingestion_mode": (None, "hi-res"),
+        }
+
+        if collection_id:
+            files["collection_ids"] = (None, json.dumps([collection_id]))
+            print(f"Creating document {requested_id} with collection_ids: [{collection_id}]")
+
+        print(f"Sending to R2R - files keys: {list(files.keys())}")
+        print(f"Metadata JSON: {files['metadata'][1]}")
+
+        async with AsyncClient() as http_client:
+            response = await http_client.post(f"{self.endpoint}/v3/documents", files=files)
+
+            if response.status_code == 422:
+                self._handle_validation_error(response, requested_id, metadata)
+                return None
+
+            response.raise_for_status()
+            return response.json()
+
+    def _handle_validation_error(self, response: object, requested_id: str, metadata: dict[str, object]) -> None:
+        """Handle validation errors from R2R API."""
+        try:
+            error_detail = getattr(response, 'json', lambda: {})() if hasattr(response, 'json') else {}
+            print(f"R2R validation error for document {requested_id}: {error_detail}")
+            print(f"Document metadata sent: {metadata}")
+            print(f"Response status: {getattr(response, 'status_code', 'unknown')}")
+            print(f"Response headers: {dict(getattr(response, 'headers', {}))}")
+        except Exception:
+            print(f"R2R validation error for document {requested_id}: {getattr(response, 'text', 'unknown error')}")
+            print(f"Document metadata sent: {metadata}")
+
+    def _process_document_response(self, doc_response: dict[str, object], requested_id: str, collection_id: str) -> str:
+        """Process successful document creation response."""
+        response_payload = doc_response.get("results", doc_response)
+        doc_id = _extract_id(response_payload, requested_id)
+
+        print(f"R2R returned document ID: {doc_id}")
+
+        if doc_id != requested_id:
+            print(f"Warning: Requested ID {requested_id} but got {doc_id}")
+
+        if collection_id:
+            print(f"Document {doc_id} should be assigned to collection {collection_id} via creation API")
+
+        return doc_id
+
+    async def _should_retry_timeout(self, error: Exception, attempt: int, max_retries: int, requested_id: str, retry_delay: float) -> bool:
+        """Determine if timeout error should be retried."""
+        if attempt >= max_retries - 1:
+            return False
+
+        print(f"Timeout for document {requested_id}, retrying in {retry_delay}s...")
+        await asyncio.sleep(retry_delay)
+        return True
+
+    async def _should_retry_http_error(self, error: HTTPStatusError, attempt: int, max_retries: int, requested_id: str, retry_delay: float) -> bool:
+        """Determine if HTTP error should be retried."""
+        if error.response.status_code < 500 or attempt >= max_retries - 1:
+            return False
+
+        print(f"Server error {error.response.status_code} for document {requested_id}, retrying in {retry_delay}s...")
+        await asyncio.sleep(retry_delay)
+        return True
+
+    def _log_document_error(self, document_id: object, exc: Exception) -> None:
+        """Log document storage errors with specific categorization."""
+        print(f"Failed to store document {document_id}: {exc}")
+
+        exc_str = str(exc)
+        if "422" in exc_str:
+            print("  → Data validation issue - check document content and metadata format")
+        elif "timeout" in exc_str.lower():
+            print("  → Network timeout - R2R may be overloaded")
+        elif "500" in exc_str:
+            print("  → Server error - R2R internal issue")
+        else:
+            import traceback
+            traceback.print_exc()
+
+    def _build_metadata(self, document: Document) -> dict[str, object]:
+        """Convert document metadata to enriched R2R format."""
+        metadata = document.metadata
+
+
+        # Core required fields
+        result: dict[str, object] = {
+            "source_url": metadata["source_url"],
+            "content_type": metadata["content_type"],
+            "word_count": metadata["word_count"],
+            "char_count": metadata["char_count"],
+            "timestamp": metadata["timestamp"].isoformat(),
+            "ingestion_source": document.source.value,
+        }
+
+        # Basic optional fields
+        if title := metadata.get("title"):
+            result["title"] = title
+        if description := metadata.get("description"):
+            result["description"] = description
+
+        # Content categorization
+        if tags := metadata.get("tags"):
+            result["tags"] = tags
+        if category := metadata.get("category"):
+            result["category"] = category
+        if section := metadata.get("section"):
+            result["section"] = section
+        if language := metadata.get("language"):
+            result["language"] = language
+
+        # Authorship and source info
+        if author := metadata.get("author"):
+            result["author"] = author
+        if domain := metadata.get("domain"):
+            result["domain"] = domain
+        if site_name := metadata.get("site_name"):
+            result["site_name"] = site_name
+
+        # Document structure
+        if heading_hierarchy := metadata.get("heading_hierarchy"):
+            result["heading_hierarchy"] = heading_hierarchy
+        if section_depth := metadata.get("section_depth"):
+            result["section_depth"] = section_depth
+        if has_code_blocks := metadata.get("has_code_blocks"):
+            result["has_code_blocks"] = has_code_blocks
+        if has_images := metadata.get("has_images"):
+            result["has_images"] = has_images
+        if has_links := metadata.get("has_links"):
+            result["has_links"] = has_links
+
+        # Processing metadata
+        if extraction_method := metadata.get("extraction_method"):
+            result["extraction_method"] = extraction_method
+        if crawl_depth := metadata.get("crawl_depth"):
+            result["crawl_depth"] = crawl_depth
+        if last_modified := metadata.get("last_modified"):
+            result["last_modified"] = last_modified.isoformat() if last_modified else None
+
+        # Content quality indicators
+        if readability_score := metadata.get("readability_score"):
+            result["readability_score"] = readability_score
+        if completeness_score := metadata.get("completeness_score"):
+            result["completeness_score"] = completeness_score
+
+        # Repository-specific fields
+        if file_path := metadata.get("file_path"):
+            result["file_path"] = file_path
+        if repository_name := metadata.get("repository_name"):
+            result["repository_name"] = repository_name
+        if branch_name := metadata.get("branch_name"):
+            result["branch_name"] = branch_name
+        if commit_hash := metadata.get("commit_hash"):
+            result["commit_hash"] = commit_hash
+        if programming_language := metadata.get("programming_language"):
+            result["programming_language"] = programming_language
+
+        # Custom business metadata
+        if importance_score := metadata.get("importance_score"):
+            result["importance_score"] = importance_score
+        if review_status := metadata.get("review_status"):
+            result["review_status"] = review_status
+        if assigned_team := metadata.get("assigned_team"):
+            result["assigned_team"] = assigned_team
+
+        return result
+
+    @override
+    async def retrieve(
+        self, document_id: str, *, collection_name: str | None = None
+    ) -> Document | None:
+        """Retrieve a document by ID."""
+        try:
+            response = await self.client.documents.retrieve(document_id)
+        except R2RException as exc:
+            status_code = getattr(exc, "status_code", None)
+            if status_code == 404:
+                return None
+            import logging
+
+            logging.warning(f"Unexpected error retrieving document {document_id}: {exc}")
+            return None
+        except Exception as error:
+            import logging
+
+            logging.warning(f"Unexpected error retrieving document {document_id}: {error}")
+            return None
+        payload = getattr(response, "results", response)
+        return self._convert_to_document(payload, collection_name)
+
+    def _convert_to_document(self, r2r_doc: object, collection_name: str | None = None) -> Document:
+        """Convert R2R document payload to our Document model."""
+        doc_map = _as_mapping(r2r_doc)
+        metadata_map = _as_mapping(doc_map.get("metadata", {}))
+
+        doc_uuid = self._extract_document_uuid(r2r_doc)
+        timestamp = _as_datetime(doc_map.get("created_at", metadata_map.get("timestamp")))
+
+        metadata = self._build_core_metadata(metadata_map, timestamp)
+        self._add_optional_metadata_fields(metadata, doc_map, metadata_map)
+
+        source_enum = self._extract_ingestion_source(metadata_map)
+        content_value = doc_map.get("content", getattr(r2r_doc, "content", ""))
+
+        return Document(
+            id=doc_uuid,
+            content=str(content_value),
+            metadata=metadata,
+            source=source_enum,
+            collection=collection_name or self.config.collection_name,
+        )
+
+    def _extract_document_uuid(self, r2r_doc: object) -> UUID:
+        """Extract and validate document UUID."""
+        doc_id_str = _extract_id(r2r_doc, str(uuid4()))
+        try:
+            return UUID(doc_id_str)
+        except ValueError:
+            return uuid4()
+
+    def _build_core_metadata(self, metadata_map: dict[str, object], timestamp: datetime) -> DocumentMetadata:
+        """Build core required metadata fields."""
+        return {
+            "source_url": str(metadata_map.get("source_url", "")),
+            "timestamp": timestamp,
+            "content_type": str(metadata_map.get("content_type", "text/plain")),
+            "word_count": _as_int(metadata_map.get("word_count")),
+            "char_count": _as_int(metadata_map.get("char_count")),
+        }
+
+    def _add_optional_metadata_fields(self, metadata: DocumentMetadata, doc_map: dict[str, object], metadata_map: dict[str, object]) -> None:
+        """Add optional metadata fields if present."""
+        self._add_title_and_description(metadata, doc_map, metadata_map)
+        self._add_content_categorization(metadata, metadata_map)
+        self._add_authorship_fields(metadata, metadata_map)
+        self._add_structure_fields(metadata, metadata_map)
+        self._add_processing_fields(metadata, metadata_map)
+        self._add_quality_scores(metadata, metadata_map)
+
+    def _add_title_and_description(self, metadata: DocumentMetadata, doc_map: dict[str, object], metadata_map: dict[str, object]) -> None:
+        """Add title and description fields."""
+        if title := (doc_map.get("title") or metadata_map.get("title")):
+            metadata["title"] = cast(str | None, title)
+
+        if summary := (doc_map.get("summary") or metadata_map.get("summary")):
+            metadata["description"] = cast(str | None, summary)
+        elif description := metadata_map.get("description"):
+            metadata["description"] = cast(str | None, description)
+
+    def _add_content_categorization(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+        """Add content categorization fields."""
+        if tags := metadata_map.get("tags"):
+            metadata["tags"] = [str(tag) for tag in tags] if isinstance(tags, list) else []
+        if category := metadata_map.get("category"):
+            metadata["category"] = str(category)
+        if section := metadata_map.get("section"):
+            metadata["section"] = str(section)
+        if language := metadata_map.get("language"):
+            metadata["language"] = str(language)
+
+    def _add_authorship_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+        """Add authorship and source information fields."""
+        if author := metadata_map.get("author"):
+            metadata["author"] = str(author)
+        if domain := metadata_map.get("domain"):
+            metadata["domain"] = str(domain)
+        if site_name := metadata_map.get("site_name"):
+            metadata["site_name"] = str(site_name)
+
+    def _add_structure_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+        """Add document structure fields."""
+        if heading_hierarchy := metadata_map.get("heading_hierarchy"):
+            metadata["heading_hierarchy"] = (
+                list(heading_hierarchy) if isinstance(heading_hierarchy, list) else []
+            )
+        if section_depth := metadata_map.get("section_depth"):
+            metadata["section_depth"] = _as_int(section_depth)
+        if has_code_blocks := metadata_map.get("has_code_blocks"):
+            metadata["has_code_blocks"] = bool(has_code_blocks)
+        if has_images := metadata_map.get("has_images"):
+            metadata["has_images"] = bool(has_images)
+        if has_links := metadata_map.get("has_links"):
+            metadata["has_links"] = bool(has_links)
+
+    def _add_processing_fields(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+        """Add processing-related metadata fields."""
+        if extraction_method := metadata_map.get("extraction_method"):
+            metadata["extraction_method"] = str(extraction_method)
+        if crawl_depth := metadata_map.get("crawl_depth"):
+            metadata["crawl_depth"] = _as_int(crawl_depth)
+        if last_modified := metadata_map.get("last_modified"):
+            metadata["last_modified"] = _as_datetime(last_modified)
+
+    def _add_quality_scores(self, metadata: DocumentMetadata, metadata_map: dict[str, object]) -> None:
+        """Add quality score fields with safe float conversion."""
+        if readability_score := metadata_map.get("readability_score"):
+            try:
+                metadata["readability_score"] = float(str(readability_score))
+            except (ValueError, TypeError):
+                metadata["readability_score"] = None
+        if completeness_score := metadata_map.get("completeness_score"):
+            try:
+                metadata["completeness_score"] = float(str(completeness_score))
+            except (ValueError, TypeError):
+                metadata["completeness_score"] = None
+
+    def _extract_ingestion_source(self, metadata_map: dict[str, object]) -> IngestionSource:
+        """Extract and validate ingestion source."""
+        source_value = str(metadata_map.get("ingestion_source", IngestionSource.WEB.value))
+        try:
+            return IngestionSource(source_value)
+        except ValueError:
+            return IngestionSource.WEB
+
+    @override
+    async def search(
+        self,
+        query: str,
+        limit: int = 10,
+        threshold: float = 0.7,
+        *,
+        collection_name: str | None = None,
+    ) -> AsyncGenerator[Document, None]:
+        """Search documents using R2R."""
+        try:
+            search_settings: dict[str, object] = {
+                "limit": limit,
+                "similarity_threshold": threshold,
+            }
+
+            if collection_name:
+                collection_id = await self._ensure_collection(collection_name)
+                search_settings["collection_ids"] = [collection_id]
+
+            search_response = await self.client.retrieval.search(
+                query=query,
+                search_settings=search_settings,
+            )
+
+            for result in _as_sequence(getattr(search_response, "results", ())):
+                result_map = _as_mapping(result)
+                document_id_value = result_map.get(
+                    "document_id", getattr(result, "document_id", None)
+                )
+                if document_id_value is None:
+                    continue
+                document_id = str(document_id_value)
+
+                try:
+                    doc_response = await self.client.documents.retrieve(document_id)
+                except R2RException as exc:
+                    import logging
+
+                    logging.warning(
+                        f"Failed to retrieve document {document_id} during search: {exc}"
+                    )
+                    continue
+
+                document_payload = getattr(doc_response, "results", doc_response)
+                document = self._convert_to_document(document_payload, collection_name)
+
+                score_value = result_map.get("score", getattr(result, "score", None))
+                if score_value is not None:
+                    try:
+                        # Handle various score value types safely
+                        if isinstance(score_value, (int, float, str)):
+                            document.score = float(score_value)
+                        else:
+                            # For unknown types, try string conversion first
+                            document.score = float(str(score_value))
+                    except (TypeError, ValueError) as e:
+                        import logging
+
+                        logging.debug(
+                            f"Invalid score value {score_value} for document {document_id}: {e}"
+                        )
+                        document.score = None
+
+                yield document
+
+        except R2RException as exc:
+            raise StorageError(f"Search failed: {exc}") from exc
+
+    @override
+    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
+        """Delete a document."""
+        try:
+            _ = await self.client.documents.delete(document_id)
+            return True
+        except R2RException:
+            return False
+
+    @override
+    async def count(self, *, collection_name: str | None = None) -> int:
+        """Get document count in collection."""
+        endpoint = self.endpoint
+        client = AsyncClient()
+        try:
+            # Get collections and find the count for the specific collection
+            response = await client.get(f"{endpoint}/v3/collections")
+            response.raise_for_status()
+            data: dict[str, object] = response.json()
+
+            target_collection = collection_name or self.config.collection_name
+            results = cast(list[dict[str, object]], data.get("results", []))
+            for collection in results:
+                if collection.get("name") == target_collection:
+                    doc_count = collection.get("document_count", 0)
+                    return _as_int(doc_count)
+
+            # Collection not found
+            return 0
+        except Exception:
+            return 0
+        finally:
+            await client.aclose()
+
+    @override
+    async def close(self) -> None:
+        """Close R2R client."""
+        try:
+            await self.client.close()
+        except Exception as e:
+            import logging
+
+            logging.warning(f"Error closing R2R client: {e}")
+
+    async def __aenter__(self) -> Self:
+        """Async context manager entry."""
+        return self
+
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: object | None,
+    ) -> None:
+        """Async context manager exit with proper cleanup."""
+        await self.close()
+
+    # Additional R2R-specific comprehensive management methods
+
+    async def create_collection(self, name: str, description: str | None = None) -> str:
+        """Create a new collection."""
+        try:
+            response = await self.client.collections.create(name=name, description=description)
+            created = _as_mapping(getattr(response, "results", {}))
+            return str(created.get("id", name))
+        except R2RException as exc:
+            raise StorageError(f"Failed to create collection {name}: {exc}") from exc
+
+    async def delete_collection(self, collection_name: str) -> bool:
+        """Delete a collection."""
+        try:
+            collection_id = await self._ensure_collection(collection_name)
+            _ = await self.client.collections.delete(collection_id)
+            return True
+        except R2RException:
+            return False
+
+    @override
+    async def list_collections(self) -> list[str]:
+        """List all available collections."""
+        endpoint = self.endpoint
+        client = AsyncClient()
+        try:
+            response = await client.get(f"{endpoint}/v3/collections")
+            response.raise_for_status()
+            data: dict[str, object] = response.json()
+
+            collection_names: list[str] = []
+            results = cast(list[dict[str, object]], data.get("results", []))
+            for entry in results:
+                if name := entry.get("name"):
+                    collection_names.append(str(name))
+            return collection_names
+        except Exception as e:
+            raise StorageError(f"Failed to list collections: {e}") from e
+        finally:
+            await client.aclose()
+
+    async def list_collections_detailed(self) -> list[dict[str, object]]:
+        """List all available collections with detailed information."""
+        try:
+            response = await self.client.collections.list()
+            collections: list[dict[str, object]] = []
+            for entry in _as_sequence(getattr(response, "results", ())):
+                entry_map = _as_mapping(entry)
+                collections.append(
+                    {
+                        "id": str(entry_map.get("id", "")),
+                        "name": str(entry_map.get("name", "")),
+                        "description": entry_map.get("description"),
+                    }
+                )
+            return collections
+        except R2RException as exc:
+            raise StorageError(f"Failed to list collections: {exc}") from exc
+
+    async def get_document_chunks(self, document_id: str) -> list[dict[str, object]]:
+        """Get all chunks for a specific document."""
+        try:
+            response = await self.client.chunks.list(filters={"document_id": document_id})
+            return [
+                dict(_as_mapping(chunk)) for chunk in _as_sequence(getattr(response, "results", ()))
+            ]
+        except R2RException as exc:
+            raise StorageError(f"Failed to get chunks for document {document_id}: {exc}") from exc
+
+    async def extract_entities(self, document_id: str) -> dict[str, object]:
+        """Extract entities and relationships from a document."""
+        try:
+            response = await self.client.documents.extract(id=document_id)
+            return dict(_as_mapping(getattr(response, "results", {})))
+        except R2RException as exc:
+            raise StorageError(
+                f"Failed to extract entities from document {document_id}: {exc}"
+            ) from exc
+
+    async def get_document_overview(self, document_id: str) -> dict[str, object]:
+        """Get comprehensive document overview and statistics."""
+        try:
+            doc_response = await self.client.documents.retrieve(document_id)
+            chunks_response = await self.client.chunks.list(filters={"document_id": document_id})
+            document_payload = dict(_as_mapping(getattr(doc_response, "results", {})))
+            chunk_payload = [
+                dict(_as_mapping(chunk))
+                for chunk in _as_sequence(getattr(chunks_response, "results", ()))
+            ]
+            return {
+                "document": document_payload,
+                "chunk_count": len(chunk_payload),
+                "chunks": chunk_payload,
+            }
+        except R2RException as exc:
+            raise StorageError(f"Failed to get overview for document {document_id}: {exc}") from exc
+
+    @override
+    async def list_documents(
+        self,
+        limit: int = 100,
+        offset: int = 0,
+        *,
+        collection_name: str | None = None,
+    ) -> list[dict[str, object]]:
+        """
+        List documents in R2R with pagination.
+
+        Args:
+            limit: Maximum number of documents to return
+            offset: Number of documents to skip
+            collection_name: Collection name (optional)
+
+        Returns:
+            List of document dictionaries with metadata
+        """
+        try:
+            documents: list[dict[str, object]] = []
+
+            if collection_name:
+                # Get collection ID first
+                collection_id = await self._ensure_collection(collection_name)
+                # Use the collections API to list documents in a specific collection
+                endpoint = self.endpoint
+                client = AsyncClient()
+                try:
+                    params = {"offset": offset, "limit": limit}
+                    response = await client.get(
+                        f"{endpoint}/v3/collections/{collection_id}/documents", params=params
+                    )
+                    response.raise_for_status()
+                    data: dict[str, object] = response.json()
+                finally:
+                    await client.aclose()
+
+                doc_sequence = _as_sequence(data.get("results", []))
+            else:
+                # List all documents
+                r2r_response = await self.client.documents.list(offset=offset, limit=limit)
+                documents_data: list[object] | dict[str, object] = getattr(
+                    r2r_response, "results", []
+                )
+
+                doc_sequence = _as_sequence(
+                    documents_data.get("results", [])
+                    if isinstance(documents_data, dict)
+                    else documents_data
+                )
+
+            for doc_data in doc_sequence:
+                doc_map = _as_mapping(doc_data)
+
+                # Extract standard document fields
+                doc_id = str(doc_map.get("id", ""))
+                title = str(doc_map.get("title", "Untitled"))
+                metadata = _as_mapping(doc_map.get("metadata", {}))
+
+                documents.append(
+                    {
+                        "id": doc_id,
+                        "title": title,
+                        "source_url": str(metadata.get("source_url", "")),
+                        "description": str(metadata.get("description", "")),
+                        "content_type": str(metadata.get("content_type", "text/plain")),
+                        "content_preview": str(doc_map.get("content", ""))[:200] + "..."
+                        if doc_map.get("content")
+                        else "",
+                        "word_count": _as_int(metadata.get("word_count", 0)),
+                        "timestamp": str(doc_map.get("created_at", "")),
+                    }
+                )
+
+            return documents
+
+        except Exception as e:
+            raise StorageError(f"Failed to list documents: {e}") from e
+</file>
+
+<file path="ingest_pipeline/storage/base.py">
+"""Base storage interface."""
+
+from abc import ABC, abstractmethod
+from collections.abc import AsyncGenerator
+
+from ..core.models import Document, StorageConfig
+
+
+class BaseStorage(ABC):
+    """Abstract base class for storage adapters."""
+
+    config: StorageConfig
+
+    def __init__(self, config: StorageConfig):
+        """
+        Initialize storage adapter.
+
+        Args:
+            config: Storage configuration
+        """
+        self.config = config
+
+    @property
+    def display_name(self) -> str:
+        """Human-readable name for UI display."""
+        return self.__class__.__name__.replace("Storage", "")
+
+    @abstractmethod
+    async def initialize(self) -> None:
+        """Initialize the storage backend and create collections if needed."""
+        pass  # pragma: no cover
+
+    @abstractmethod
+    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
+        """
+        Store a single document.
+
+        Args:
+            document: Document to store
+
+        Returns:
+            Document ID
+        """
+        pass  # pragma: no cover
+
+    @abstractmethod
+    async def store_batch(
+        self, documents: list[Document], *, collection_name: str | None = None
+    ) -> list[str]:
+        """
+        Store multiple documents in batch.
+
+        Args:
+            documents: List of documents to store
+
+        Returns:
+            List of document IDs
+        """
+        pass  # pragma: no cover
+
+    async def retrieve(
+        self, document_id: str, *, collection_name: str | None = None
+    ) -> Document | None:
+        """
+        Retrieve a document by ID (if supported by backend).
+
+        Args:
+            document_id: Document ID
+
+        Returns:
+            Document or None if not found
+
+        Raises:
+            NotImplementedError: If backend doesn't support retrieval
+        """
+        raise NotImplementedError(f"{self.__class__.__name__} doesn't support document retrieval")
+
+    async def check_exists(
+        self, document_id: str, *, collection_name: str | None = None, stale_after_days: int = 30
+    ) -> bool:
+        """
+        Check if a document exists and is not stale.
+
+        Args:
+            document_id: Document ID to check
+            collection_name: Collection to check in
+            stale_after_days: Consider document stale after this many days
+
+        Returns:
+            True if document exists and is not stale, False otherwise
+        """
+        try:
+            document = await self.retrieve(document_id, collection_name=collection_name)
+            if document is None:
+                return False
+
+            # Check staleness if timestamp is available
+            if "timestamp" in document.metadata:
+                from datetime import UTC, datetime, timedelta
+                timestamp_obj = document.metadata["timestamp"]
+                if isinstance(timestamp_obj, datetime):
+                    timestamp = timestamp_obj
+                    cutoff = datetime.now(UTC) - timedelta(days=stale_after_days)
+                    return timestamp >= cutoff
+
+            # If no timestamp, assume it exists and is valid
+            return True
+        except Exception:
+            # Backend doesn't support retrieval, assume doesn't exist
+            return False
+
+    def search(
+        self,
+        query: str,
+        limit: int = 10,
+        threshold: float = 0.7,
+        *,
+        collection_name: str | None = None,
+    ) -> AsyncGenerator[Document, None]:
+        """
+        Search for documents (if supported by backend).
+
+        Args:
+            query: Search query
+            limit: Maximum number of results
+            threshold: Similarity threshold
+
+        Yields:
+            Matching documents
+
+        Raises:
+            NotImplementedError: If backend doesn't support search
+        """
+        raise NotImplementedError(f"{self.__class__.__name__} doesn't support search")
+
+    @abstractmethod
+    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
+        """
+        Delete a document.
+
+        Args:
+            document_id: Document ID
+
+        Returns:
+            True if deleted successfully
+        """
+        pass  # pragma: no cover
+
+    async def count(self, *, collection_name: str | None = None) -> int:
+        """
+        Get total document count (if supported by backend).
+
+        Returns:
+            Number of documents, 0 if not supported
+        """
+        return 0
+
+    async def list_collections(self) -> list[str]:
+        """
+        List available collections (if supported by backend).
+
+        Returns:
+            List of collection names, empty list if not supported
+        """
+        return []
+
+    async def describe_collections(self) -> list[dict[str, object]]:
+        """
+        Describe available collections with metadata (if supported by backend).
+
+        Returns:
+            List of collection metadata dictionaries, empty list if not supported
+        """
+        return []
+
+    async def delete_collection(self, collection_name: str) -> bool:
+        """
+        Delete a collection (if supported by backend).
+
+        Args:
+            collection_name: Name of collection to delete
+
+        Returns:
+            True if deleted successfully, False if not supported
+        """
+        return False
+
+    async def delete_documents(
+        self, document_ids: list[str], *, collection_name: str | None = None
+    ) -> dict[str, bool]:
+        """
+        Delete documents by IDs (if supported by backend).
+
+        Args:
+            document_ids: List of document IDs to delete
+            collection_name: Collection to delete from
+
+        Returns:
+            Dict mapping document IDs to success status, empty if not supported
+        """
+        return {}
+
+    async def list_documents(
+        self,
+        limit: int = 100,
+        offset: int = 0,
+        *,
+        collection_name: str | None = None,
+    ) -> list[dict[str, object]]:
+        """
+        List documents in the storage backend (if supported).
+
+        Args:
+            limit: Maximum number of documents to return
+            offset: Number of documents to skip
+            collection_name: Collection to list documents from
+
+        Returns:
+            List of document dictionaries with metadata
+
+        Raises:
+            NotImplementedError: If backend doesn't support document listing
+        """
+        raise NotImplementedError(f"{self.__class__.__name__} doesn't support document listing")
+
+    async def close(self) -> None:
+        """
+        Close storage connections and cleanup resources.
+
+        Default implementation does nothing.
+        """
+        # Default implementation - storage backends can override to cleanup connections
+        return None
+</file>
+
+<file path="ingest_pipeline/storage/openwebui.py">
+"""Open WebUI storage adapter."""
+
+import asyncio
+import logging
+from typing import TYPE_CHECKING, Final, TypedDict, cast
+
+import httpx
+from typing_extensions import override
+
+if TYPE_CHECKING:
+    # Type checking imports - these will be ignored at runtime
+    from httpx import AsyncClient, ConnectError, HTTPStatusError, RequestError
+else:
+    # Runtime imports that work properly
+    AsyncClient = httpx.AsyncClient
+    ConnectError = httpx.ConnectError
+    HTTPStatusError = httpx.HTTPStatusError
+    RequestError = httpx.RequestError
+
+from ..core.exceptions import StorageError
+from ..core.models import Document, StorageConfig
+from .base import BaseStorage
+
+LOGGER: Final[logging.Logger] = logging.getLogger(__name__)
+
+
+class OpenWebUIStorage(BaseStorage):
+    """Storage adapter for Open WebUI knowledge endpoints."""
+
+    client: AsyncClient
+    _knowledge_cache: dict[str, str]
+
+    def __init__(self, config: StorageConfig):
+        """
+        Initialize Open WebUI storage.
+
+        Args:
+            config: Storage configuration
+        """
+        super().__init__(config)
+
+        headers: dict[str, str] = {}
+        if config.api_key:
+            headers["Authorization"] = f"Bearer {config.api_key}"
+
+        self.client = AsyncClient(
+            base_url=str(config.endpoint),
+            headers=headers,
+            timeout=30.0,
+        )
+        self._knowledge_cache = {}
+
+    @override
+    async def initialize(self) -> None:
+        """Initialize Open WebUI connection."""
+        try:
+            if self.config.collection_name:
+                await self._get_knowledge_id(
+                    self.config.collection_name,
+                    create=True,
+                )
+
+        except ConnectError as e:
+            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
+        except HTTPStatusError as e:
+            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
+        except RequestError as e:
+            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to initialize Open WebUI: {e}") from e
+
+    async def _create_collection(self, name: str) -> str:
+        """Create knowledge base in Open WebUI."""
+        try:
+            response = await self.client.post(
+                "/api/v1/knowledge/create",
+                json={
+                    "name": name,
+                    "description": "Documents ingested from various sources",
+                    "data": {},
+                    "access_control": None,
+                },
+            )
+            response.raise_for_status()
+            result = response.json()
+            knowledge_id = result.get("id")
+
+            if not knowledge_id or not isinstance(knowledge_id, str):
+                raise StorageError("Knowledge base creation failed: no ID returned")
+
+            return str(knowledge_id)
+
+        except ConnectError as e:
+            raise StorageError(f"Connection to OpenWebUI failed during creation: {e}") from e
+        except HTTPStatusError as e:
+            raise StorageError(
+                f"OpenWebUI returned error {e.response.status_code} during creation: {e}"
+            ) from e
+        except RequestError as e:
+            raise StorageError(f"Request to OpenWebUI failed during creation: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to create knowledge base: {e}") from e
+
+    async def _fetch_knowledge_bases(self) -> list[dict[str, object]]:
+        """Return the list of knowledge bases from the API."""
+        response = await self.client.get("/api/v1/knowledge/list")
+        response.raise_for_status()
+        data = response.json()
+        if not isinstance(data, list):
+            return []
+        normalized: list[dict[str, object]] = []
+        for item in data:
+            if isinstance(item, dict):
+                item_dict: dict[str, object] = item
+                normalized.append({str(k): v for k, v in item_dict.items()})
+        return normalized
+
+    async def _get_knowledge_id(
+        self,
+        name: str | None,
+        *,
+        create: bool,
+    ) -> str | None:
+        """Retrieve (and optionally create) a knowledge base identifier."""
+        target_raw = name or self.config.collection_name
+        target = str(target_raw) if target_raw else ""
+        if not target:
+            raise StorageError("Knowledge base name is required")
+
+        if cached := self._knowledge_cache.get(target):
+            return cached
+
+        knowledge_bases = await self._fetch_knowledge_bases()
+        for kb in knowledge_bases:
+            if kb.get("name") == target:
+                kb_id = kb.get("id")
+                if isinstance(kb_id, str):
+                    self._knowledge_cache[target] = kb_id
+                    return kb_id
+
+        if not create:
+            return None
+
+        knowledge_id = await self._create_collection(target)
+        self._knowledge_cache[target] = knowledge_id
+        return knowledge_id
+
+    @override
+    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
+        """
+        Store a document in Open WebUI as a file.
+
+        Args:
+            document: Document to store
+
+        Returns:
+            File ID
+        """
+        try:
+            knowledge_id = await self._get_knowledge_id(
+                collection_name,
+                create=True,
+            )
+            if not knowledge_id:
+                raise StorageError("Knowledge base not initialized")
+
+            # Step 1: Upload document as file
+            # Use document title from metadata if available, otherwise fall back to ID
+            filename = document.metadata.get("title") or f"doc_{document.id}"
+            # Ensure filename has proper extension
+            if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
+                filename = f"{filename}.txt"
+            files = {"file": (filename, document.content.encode(), "text/plain")}
+            response = await self.client.post(
+                "/api/v1/files/",
+                files=files,
+                params={"process": True, "process_in_background": False},
+            )
+            response.raise_for_status()
+
+            file_data = response.json()
+            file_id = file_data.get("id")
+
+            if not file_id or not isinstance(file_id, str):
+                raise StorageError("File upload failed: no file ID returned")
+
+            # Step 2: Add file to knowledge base
+            response = await self.client.post(
+                f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
+            )
+            response.raise_for_status()
+
+            return str(file_id)
+
+        except ConnectError as e:
+            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
+        except HTTPStatusError as e:
+            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
+        except RequestError as e:
+            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to store document: {e}") from e
+
+    @override
+    async def store_batch(
+        self, documents: list[Document], *, collection_name: str | None = None
+    ) -> list[str]:
+        """
+        Store multiple documents as files in batch.
+
+        Args:
+            documents: List of documents
+
+        Returns:
+            List of file IDs
+        """
+        try:
+            knowledge_id = await self._get_knowledge_id(
+                collection_name,
+                create=True,
+            )
+            if not knowledge_id:
+                raise StorageError("Knowledge base not initialized")
+
+            async def upload_and_attach(doc: Document) -> str:
+                # Use document title from metadata if available, otherwise fall back to ID
+                filename = doc.metadata.get("title") or f"doc_{doc.id}"
+                # Ensure filename has proper extension
+                if not filename.endswith(('.txt', '.md', '.pdf', '.doc', '.docx')):
+                    filename = f"{filename}.txt"
+                files = {"file": (filename, doc.content.encode(), "text/plain")}
+                upload_response = await self.client.post(
+                    "/api/v1/files/",
+                    files=files,
+                    params={"process": True, "process_in_background": False},
+                )
+                upload_response.raise_for_status()
+
+                file_data = upload_response.json()
+                file_id = file_data.get("id")
+
+                if not file_id or not isinstance(file_id, str):
+                    raise StorageError(
+                        f"File upload failed for document {doc.id}: no file ID returned"
+                    )
+
+                attach_response = await self.client.post(
+                    f"/api/v1/knowledge/{knowledge_id}/file/add", json={"file_id": file_id}
+                )
+                attach_response.raise_for_status()
+
+                return str(file_id)
+
+            tasks = [upload_and_attach(doc) for doc in documents]
+            results = await asyncio.gather(*tasks, return_exceptions=True)
+
+            file_ids: list[str] = []
+            failures: list[str] = []
+
+            for index, result in enumerate(results):
+                doc = documents[index]
+                if isinstance(result, Exception):
+                    failures.append(f"{doc.id}: {result}")
+                else:
+                    file_ids.append(cast(str, result))
+
+            if failures:
+                LOGGER.warning(
+                    "OpenWebUI partial batch failure for knowledge base %s: %s",
+                    self.config.collection_name,
+                    ", ".join(failures),
+                )
+
+            return file_ids
+
+        except ConnectError as e:
+            raise StorageError(f"Connection to OpenWebUI failed during batch: {e}") from e
+        except HTTPStatusError as e:
+            raise StorageError(
+                f"OpenWebUI returned error {e.response.status_code} during batch: {e}"
+            ) from e
+        except RequestError as e:
+            raise StorageError(f"Request to OpenWebUI failed during batch: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to store batch: {e}") from e
+
+    @override
+    async def retrieve(
+        self, document_id: str, *, collection_name: str | None = None
+    ) -> Document | None:
+        """
+        OpenWebUI doesn't support document retrieval by ID.
+
+        Args:
+            document_id: File ID (not supported)
+            collection_name: Collection name (not used)
+
+        Returns:
+            Always None - retrieval not supported
+        """
+        # OpenWebUI uses file-based storage without direct document retrieval
+        # This will cause the base check_exists method to return False,
+        # which means documents will always be re-scraped for OpenWebUI
+        raise NotImplementedError("OpenWebUI doesn't support document retrieval by ID")
+
+    @override
+    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
+        """
+        Remove a file from Open WebUI knowledge base.
+
+        Args:
+            document_id: File ID to remove
+
+        Returns:
+            True if removed successfully
+        """
+        try:
+            knowledge_id = await self._get_knowledge_id(
+                collection_name,
+                create=False,
+            )
+            if not knowledge_id:
+                return False
+
+            # Remove file from knowledge base
+            response = await self.client.post(
+                f"/api/v1/knowledge/{knowledge_id}/file/remove", json={"file_id": document_id}
+            )
+            response.raise_for_status()
+
+            delete_response = await self.client.delete(f"/api/v1/files/{document_id}")
+            if delete_response.status_code == 404:
+                return True
+            delete_response.raise_for_status()
+            return True
+
+        except ConnectError as exc:
+            LOGGER.error(
+                "Failed to reach OpenWebUI when deleting file %s", document_id, exc_info=exc
+            )
+            return False
+        except HTTPStatusError as exc:
+            LOGGER.error(
+                "OpenWebUI returned status error %s when deleting file %s",
+                exc.response.status_code if exc.response else "unknown",
+                document_id,
+                exc_info=exc,
+            )
+            return False
+        except RequestError as exc:
+            LOGGER.error("Request error deleting file %s from OpenWebUI", document_id, exc_info=exc)
+            return False
+        except Exception as exc:
+            LOGGER.error("Unexpected error deleting file %s", document_id, exc_info=exc)
+            return False
+
+    async def list_collections(self) -> list[str]:
+        """
+        List all available knowledge bases.
+
+        Returns:
+            List of knowledge base names
+        """
+        try:
+            knowledge_bases = await self._fetch_knowledge_bases()
+
+            # Extract names from knowledge bases
+            return [
+                str(kb.get("name", f"knowledge_{kb.get('id', 'unknown')}") or "")
+                for kb in knowledge_bases
+            ]
+
+        except ConnectError as e:
+            raise StorageError(f"Connection to OpenWebUI failed: {e}") from e
+        except HTTPStatusError as e:
+            raise StorageError(f"OpenWebUI returned error {e.response.status_code}: {e}") from e
+        except RequestError as e:
+            raise StorageError(f"Request to OpenWebUI failed: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to list knowledge bases: {e}") from e
+
+    async def delete_collection(self, collection_name: str) -> bool:
+        """
+        Delete a knowledge base by name.
+
+        Args:
+            collection_name: Name of the knowledge base to delete
+
+        Returns:
+            True if deleted successfully, False otherwise
+        """
+        try:
+            knowledge_id = await self._get_knowledge_id(collection_name, create=False)
+            if not knowledge_id:
+                # Collection doesn't exist, consider it already deleted
+                return True
+
+            # Delete the knowledge base using the OpenWebUI API
+            response = await self.client.delete(f"/api/v1/knowledge/{knowledge_id}/delete")
+            response.raise_for_status()
+
+            # Remove from cache if it exists
+            if collection_name in self._knowledge_cache:
+                del self._knowledge_cache[collection_name]
+
+            LOGGER.info("Successfully deleted knowledge base: %s", collection_name)
+            return True
+
+        except HTTPStatusError as e:
+            # Handle 404 as success (already deleted)
+            if e.response.status_code == 404:
+                LOGGER.info("Knowledge base %s was already deleted or not found", collection_name)
+                return True
+            LOGGER.error(
+                "OpenWebUI returned error %s when deleting knowledge base %s",
+                e.response.status_code,
+                collection_name,
+                exc_info=e,
+            )
+            return False
+        except ConnectError as e:
+            LOGGER.error(
+                "Failed to reach OpenWebUI when deleting knowledge base %s",
+                collection_name,
+                exc_info=e,
+            )
+            return False
+        except RequestError as e:
+            LOGGER.error(
+                "Request error deleting knowledge base %s from OpenWebUI",
+                collection_name,
+                exc_info=e,
+            )
+            return False
+        except Exception as e:
+            LOGGER.error("Unexpected error deleting knowledge base %s", collection_name, exc_info=e)
+            return False
+
+    class CollectionSummary(TypedDict):
+        """Structure describing a knowledge base summary."""
+
+        name: str
+        count: int
+        size_mb: float
+
+
+    async def _get_knowledge_base_count(self, kb: dict[str, object]) -> int:
+        """Get the file count for a knowledge base."""
+        kb_id = kb.get("id")
+        name = kb.get("name", "Unknown")
+
+        if not kb_id:
+            return self._count_files_from_basic_info(kb)
+
+        return await self._count_files_from_detailed_info(str(kb_id), str(name), kb)
+
+    def _count_files_from_basic_info(self, kb: dict[str, object]) -> int:
+        """Count files from basic knowledge base info."""
+        files = kb.get("files", [])
+        return len(files) if isinstance(files, list) and files is not None else 0
+
+    async def _count_files_from_detailed_info(self, kb_id: str, name: str, kb: dict[str, object]) -> int:
+        """Count files by fetching detailed knowledge base info."""
+        try:
+            LOGGER.debug(f"Fetching detailed info for KB '{name}' from /api/v1/knowledge/{kb_id}")
+            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
+            detail_response.raise_for_status()
+            detailed_kb = detail_response.json()
+
+            files = detailed_kb.get("files", [])
+            count = len(files) if isinstance(files, list) and files is not None else 0
+
+            LOGGER.info(f"Knowledge base '{name}' (ID: {kb_id}): found {count} files")
+            return count
+
+        except Exception as e:
+            LOGGER.warning(f"Failed to get detailed info for KB '{name}' (ID: {kb_id}): {e}")
+            return self._count_files_from_basic_info(kb)
+
+    async def describe_collections(self) -> list[dict[str, object]]:
+        """Return metadata about each knowledge base."""
+        try:
+            knowledge_bases = await self._fetch_knowledge_bases()
+            collections: list[dict[str, object]] = []
+
+            for kb in knowledge_bases:
+                if not isinstance(kb, dict):
+                    continue
+
+                count = await self._get_knowledge_base_count(kb)
+                name = kb.get("name", "Unknown")
+                size_mb = count * 0.5  # rough heuristic
+
+                summary: dict[str, object] = {
+                    "name": str(name),
+                    "count": count,
+                    "size_mb": float(size_mb),
+                }
+                collections.append(summary)
+
+            return collections
+
+        except Exception as e:
+            raise StorageError(f"Failed to describe knowledge bases: {e}") from e
+
+    async def count(self, *, collection_name: str | None = None) -> int:
+        """
+        Get document count for a specific collection (knowledge base).
+
+        Args:
+            collection_name: Name of the knowledge base to count documents for
+
+        Returns:
+            Number of documents in the collection, 0 if collection not found
+        """
+        if not collection_name:
+            # If no collection name provided, return total across all collections
+            try:
+                collections = await self.describe_collections()
+                return sum(
+                    int(collection["count"]) if isinstance(collection["count"], (int, str)) else 0
+                    for collection in collections
+                )
+            except Exception:
+                return 0
+
+        try:
+            # Get knowledge base by name and return its file count
+            kb = await self.get_knowledge_by_name(collection_name)
+            if not kb:
+                return 0
+
+            kb_id = kb.get("id")
+            if not kb_id:
+                return 0
+
+            # Get detailed knowledge base information to get accurate file count
+            detail_response = await self.client.get(f"/api/v1/knowledge/{kb_id}")
+            detail_response.raise_for_status()
+            detailed_kb = detail_response.json()
+
+            files = detailed_kb.get("files", [])
+            count = len(files) if isinstance(files, list) else 0
+
+            LOGGER.debug(f"Count for collection '{collection_name}': {count} files")
+            return count
+
+        except Exception as e:
+            LOGGER.warning(f"Failed to get count for collection '{collection_name}': {e}")
+            return 0
+
+    async def get_knowledge_by_name(self, name: str) -> dict[str, object] | None:
+        """
+        Get knowledge base details by name.
+
+        Args:
+            name: Knowledge base name
+
+        Returns:
+            Knowledge base details or None if not found
+        """
+        try:
+            response = await self.client.get("/api/v1/knowledge/list")
+            response.raise_for_status()
+            knowledge_bases = response.json()
+
+            return next(
+                (
+                    {str(k): v for k, v in kb.items()}
+                    for kb in knowledge_bases
+                    if isinstance(kb, dict) and kb.get("name") == name
+                ),
+                None,
+            )
+        except Exception as e:
+            raise StorageError(f"Failed to get knowledge base by name: {e}") from e
+
+    async def __aenter__(self) -> "OpenWebUIStorage":
+        """Async context manager entry."""
+        await self.initialize()
+        return self
+
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: object | None,
+    ) -> None:
+        """Async context manager exit."""
+        await self.close()
+
+    async def list_documents(
+        self,
+        limit: int = 100,
+        offset: int = 0,
+        *,
+        collection_name: str | None = None,
+    ) -> list[dict[str, object]]:
+        """
+        List documents (files) in a knowledge base.
+
+        NOTE: This is a basic implementation that attempts to extract file information
+        from OpenWebUI knowledge bases. The actual file listing capabilities depend
+        on the OpenWebUI API version and may not include detailed file metadata.
+
+        Args:
+            limit: Maximum number of documents to return
+            offset: Number of documents to skip
+            collection_name: Knowledge base name
+
+        Returns:
+            List of document dictionaries with available metadata
+        """
+        try:
+            # Use the knowledge base name or fall back to default
+            kb_name = collection_name or self.config.collection_name or "default"
+
+            # Try to get knowledge base details
+            knowledge_base = await self.get_knowledge_by_name(kb_name)
+            if not knowledge_base:
+                # If specific KB not found, return empty list with a note
+                return []
+
+            # Extract files if available (API structure may vary)
+            files = knowledge_base.get("files", [])
+
+            # Handle different possible API response structures
+            if not isinstance(files, list):
+                # Some API versions might structure this differently
+                # Try to handle gracefully
+                return [
+                    {
+                        "id": "unknown",
+                        "title": f"Knowledge Base: {kb_name}",
+                        "source_url": "",
+                        "description": "OpenWebUI knowledge base (file details not available)",
+                        "content_type": "text/plain",
+                        "content_preview": "Document listing not fully supported for OpenWebUI",
+                        "word_count": 0,
+                        "timestamp": "",
+                    }
+                ]
+
+            # Apply pagination
+            paginated_files = files[offset : offset + limit]
+
+            # Convert to document format with safe field access
+            documents: list[dict[str, object]] = []
+            for i, file_info in enumerate(paginated_files):
+                if not isinstance(file_info, dict):
+                    continue
+
+                # Safely extract fields with fallbacks
+                doc_id = str(file_info.get("id", f"file_{i}"))
+
+                # Try multiple ways to get filename from OpenWebUI API response
+                filename = None
+                # Check direct filename field
+                if "filename" in file_info:
+                    filename = file_info["filename"]
+                # Check name field
+                elif "name" in file_info:
+                    filename = file_info["name"]
+                # Check meta.name (from FileModelResponse schema)
+                elif isinstance(file_info.get("meta"), dict):
+                    filename = file_info["meta"].get("name")
+
+                # Final fallback
+                if not filename:
+                    filename = f"file_{i}"
+
+                filename = str(filename)
+
+                # Extract size from meta if available
+                size = 0
+                if isinstance(file_info.get("meta"), dict):
+                    size = file_info["meta"].get("size", 0)
+                else:
+                    size = file_info.get("size", 0)
+
+                # Estimate word count from file size (very rough approximation)
+                word_count = max(1, int(size / 6)) if isinstance(size, (int, float)) else 0
+
+                documents.append(
+                    {
+                        "id": doc_id,
+                        "title": filename,
+                        "source_url": "",  # OpenWebUI files don't typically have source URLs
+                        "description": f"File: {filename}",
+                        "content_type": str(file_info.get("content_type", "text/plain")),
+                        "content_preview": f"File uploaded to OpenWebUI: {filename}",
+                        "word_count": word_count,
+                        "timestamp": str(
+                            file_info.get("created_at") or file_info.get("timestamp", "")
+                        ),
+                    }
+                )
+
+            return documents
+
+        except Exception as e:
+            # Since OpenWebUI file listing API structure is not guaranteed,
+            # we gracefully fall back rather than raise an error
+            import logging
+
+            logging.warning(f"OpenWebUI document listing failed: {e}")
+
+            # Return a placeholder entry indicating limited support
+            return [
+                {
+                    "id": "api_error",
+                    "title": f"Knowledge Base: {collection_name or 'default'}",
+                    "source_url": "",
+                    "description": "Document listing encountered an error - API compatibility issue",
+                    "content_type": "text/plain",
+                    "content_preview": f"Error: {str(e)[:100]}...",
+                    "word_count": 0,
+                    "timestamp": "",
+                }
+            ]
+
+    async def close(self) -> None:
+        """Close client connection."""
+        if hasattr(self, "client") and self.client:
+            try:
+                await self.client.aclose()
+            except Exception as e:
+                import logging
+
+                logging.warning(f"Error closing OpenWebUI client: {e}")
+</file>
+
+<file path="ingest_pipeline/storage/weaviate.py">
+"""Weaviate storage adapter."""
+
+from collections.abc import AsyncGenerator, Mapping, Sequence
+from datetime import UTC, datetime
+from typing import Literal, Self, TypeAlias, cast, overload
+from uuid import UUID
+
+import weaviate
+from typing_extensions import override
+from weaviate.classes.config import Configure, DataType, Property
+from weaviate.classes.data import DataObject
+from weaviate.classes.query import Filter
+from weaviate.collections import Collection
+from weaviate.exceptions import (
+    WeaviateBatchError,
+    WeaviateConnectionError,
+    WeaviateQueryError,
+)
+
+from ..core.exceptions import StorageError
+from ..core.models import Document, DocumentMetadata, IngestionSource, StorageConfig
+from ..utils.vectorizer import Vectorizer
+from .base import BaseStorage
+
+VectorContainer: TypeAlias = Mapping[str, object] | Sequence[object] | None
+
+
+class WeaviateStorage(BaseStorage):
+    """Storage adapter for Weaviate."""
+
+    client: weaviate.WeaviateClient | None
+    vectorizer: Vectorizer
+    _default_collection: str
+
+    def __init__(self, config: StorageConfig):
+        """
+        Initialize Weaviate storage.
+
+        Args:
+            config: Storage configuration
+        """
+        super().__init__(config)
+        self.client = None
+        self.vectorizer = Vectorizer(config)
+        self._default_collection = self._normalize_collection_name(config.collection_name)
+
+    @override
+    async def initialize(self) -> None:
+        """Initialize Weaviate client and create collection if needed."""
+        try:
+            # Let Weaviate client handle URL parsing
+            self.client = weaviate.WeaviateClient(
+                connection_params=weaviate.connect.ConnectionParams.from_url(
+                    url=str(self.config.endpoint),
+                    grpc_port=50051,  # Default gRPC port
+                ),
+                additional_config=weaviate.classes.init.AdditionalConfig(
+                    timeout=weaviate.classes.init.Timeout(init=30, query=60, insert=120),
+                ),
+            )
+
+            # Connect to the client
+            self.client.connect()
+
+            # Ensure the default collection exists
+            await self._ensure_collection(self._default_collection)
+
+        except WeaviateConnectionError as e:
+            raise StorageError(f"Failed to connect to Weaviate: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to initialize Weaviate: {e}") from e
+
+    async def _create_collection(self, collection_name: str) -> None:
+        """Create Weaviate collection with schema."""
+        if not self.client:
+            raise StorageError("Weaviate client not initialized")
+        try:
+            client = cast(weaviate.WeaviateClient, self.client)
+            client.collections.create(
+                name=collection_name,
+                properties=[
+                    Property(
+                        name="content", data_type=DataType.TEXT, description="Document content"
+                    ),
+                    Property(name="source_url", data_type=DataType.TEXT, description="Source URL"),
+                    Property(name="title", data_type=DataType.TEXT, description="Document title"),
+                    Property(
+                        name="description",
+                        data_type=DataType.TEXT,
+                        description="Document description",
+                    ),
+                    Property(
+                        name="timestamp", data_type=DataType.DATE, description="Ingestion timestamp"
+                    ),
+                    Property(
+                        name="content_type", data_type=DataType.TEXT, description="Content type"
+                    ),
+                    Property(name="word_count", data_type=DataType.INT, description="Word count"),
+                    Property(
+                        name="char_count", data_type=DataType.INT, description="Character count"
+                    ),
+                    Property(
+                        name="source", data_type=DataType.TEXT, description="Ingestion source"
+                    ),
+                ],
+                vectorizer_config=Configure.Vectorizer.none(),
+            )
+        except Exception as e:
+            raise StorageError(f"Failed to create collection: {e}") from e
+
+    @staticmethod
+    def _extract_vector(vector_raw: VectorContainer) -> list[float] | None:
+        """Normalize vector payloads returned by Weaviate into a float list."""
+        if isinstance(vector_raw, Mapping):
+            default_vector = vector_raw.get("default")
+            return WeaviateStorage._extract_vector(
+                cast(VectorContainer, default_vector)
+            )
+
+        if not isinstance(vector_raw, Sequence) or isinstance(
+            vector_raw, (str, bytes, bytearray)
+        ):
+            return None
+
+        items = list(vector_raw)
+        if not items:
+            return None
+
+        first_item = items[0]
+        if isinstance(first_item, (int, float)):
+            numeric_items = cast(list[int | float], items)
+            try:
+                return [float(value) for value in numeric_items]
+            except (TypeError, ValueError):
+                return None
+
+        if isinstance(first_item, Sequence) and not isinstance(
+            first_item, (str, bytes, bytearray)
+        ):
+            inner_items = list(first_item)
+            if all(isinstance(item, (int, float)) for item in inner_items):
+                try:
+                    numeric_inner = cast(list[int | float], inner_items)
+                    return [float(item) for item in numeric_inner]
+                except (TypeError, ValueError):
+                    return None
+
+        return None
+
+    @staticmethod
+    def _parse_source(source_raw: object) -> IngestionSource:
+        """Safely normalize persistence source values into enum instances."""
+        if isinstance(source_raw, IngestionSource):
+            return source_raw
+
+        if isinstance(source_raw, str):
+            try:
+                return IngestionSource(source_raw)
+            except ValueError:
+                return IngestionSource.WEB
+
+        return IngestionSource.WEB
+
+    @staticmethod
+    @overload
+    def _coerce_properties(
+        properties: object,
+        *,
+        context: str,
+    ) -> Mapping[str, object]:
+        ...
+
+    @staticmethod
+    @overload
+    def _coerce_properties(
+        properties: object,
+        *,
+        context: str,
+        allow_missing: Literal[False],
+    ) -> Mapping[str, object]:
+        ...
+
+    @staticmethod
+    @overload
+    def _coerce_properties(
+        properties: object,
+        *,
+        context: str,
+        allow_missing: Literal[True],
+    ) -> Mapping[str, object] | None:
+        ...
+
+    @staticmethod
+    def _coerce_properties(
+        properties: object,
+        *,
+        context: str,
+        allow_missing: bool = False,
+    ) -> Mapping[str, object] | None:
+        """Ensure Weaviate properties payloads are mappings."""
+        if properties is None:
+            if allow_missing:
+                return None
+            raise StorageError(f"{context} returned object without properties")
+
+        if not isinstance(properties, Mapping):
+            raise StorageError(
+                f"{context} returned invalid properties payload of type {type(properties)!r}"
+            )
+
+        return cast(Mapping[str, object], properties)
+
+    def _normalize_collection_name(self, collection_name: str | None) -> str:
+        """Return a canonicalized collection name, defaulting to configured value."""
+        candidate = collection_name or self.config.collection_name
+        if not candidate:
+            raise StorageError("Collection name is required")
+
+        if normalized := candidate.strip():
+            return normalized[0].upper() + normalized[1:]
+        else:
+            raise StorageError("Collection name cannot be empty")
+
+    async def _ensure_collection(self, collection_name: str) -> None:
+        """Create the collection if missing."""
+        if not self.client:
+            raise StorageError("Weaviate client not initialized")
+
+        client = cast(weaviate.WeaviateClient, self.client)
+        existing = client.collections.list_all()
+        if collection_name not in existing:
+            await self._create_collection(collection_name)
+
+    async def _prepare_collection(
+        self,
+        collection_name: str | None,
+        *,
+        ensure_exists: bool,
+    ) -> tuple[Collection, str]:
+        """Return a ready collection handle and normalized name."""
+        normalized = self._normalize_collection_name(collection_name)
+
+        if not self.client:
+            raise StorageError("Weaviate client not initialized")
+
+        if ensure_exists:
+            await self._ensure_collection(normalized)
+
+        client = cast(weaviate.WeaviateClient, self.client)
+        return client.collections.get(normalized), normalized
+
+    @override
+    async def store(self, document: Document, *, collection_name: str | None = None) -> str:
+        """
+        Store a document in Weaviate.
+
+        Args:
+            document: Document to store
+
+        Returns:
+            Document ID
+        """
+        try:
+            # Vectorize content if no vector provided
+            if document.vector is None:
+                document.vector = await self.vectorizer.vectorize(document.content)
+
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=True
+            )
+
+            # Prepare properties
+            properties = {
+                "content": document.content,
+                "source_url": document.metadata["source_url"],
+                "title": document.metadata.get("title", ""),
+                "description": document.metadata.get("description", ""),
+                "timestamp": document.metadata["timestamp"].isoformat(),
+                "content_type": document.metadata["content_type"],
+                "word_count": document.metadata["word_count"],
+                "char_count": document.metadata["char_count"],
+                "source": document.source.value,
+            }
+
+            # Insert with vector
+            result = collection.data.insert(
+                properties=properties, vector=document.vector, uuid=str(document.id)
+            )
+
+            return str(result)
+
+        except Exception as e:
+            raise StorageError(f"Failed to store document: {e}") from e
+
+    @override
+    async def store_batch(
+        self, documents: list[Document], *, collection_name: str | None = None
+    ) -> list[str]:
+        """
+        Store multiple documents using proper batch operations.
+
+        Args:
+            documents: List of documents
+
+        Returns:
+            List of successfully stored document IDs
+        """
+        try:
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=True
+            )
+
+            # Vectorize documents without vectors
+            for doc in documents:
+                if doc.vector is None:
+                    doc.vector = await self.vectorizer.vectorize(doc.content)
+
+            # Prepare batch data for insert_many
+            batch_objects = []
+            for doc in documents:
+                properties = {
+                    "content": doc.content,
+                    "source_url": doc.metadata["source_url"],
+                    "title": doc.metadata.get("title", ""),
+                    "description": doc.metadata.get("description", ""),
+                    "timestamp": doc.metadata["timestamp"].isoformat(),
+                    "content_type": doc.metadata["content_type"],
+                    "word_count": doc.metadata["word_count"],
+                    "char_count": doc.metadata["char_count"],
+                    "source": doc.source.value,
+                }
+
+                batch_objects.append(
+                    DataObject(properties=properties, vector=doc.vector, uuid=str(doc.id))
+                )
+
+            # Insert batch using insert_many
+            response = collection.data.insert_many(batch_objects)
+
+            successful_ids: list[str] = []
+            error_indices = set(response.errors.keys()) if response else set()
+
+            for index, doc in enumerate(documents):
+                if index in error_indices:
+                    continue
+
+                uuid_value = response.uuids.get(index) if response else None
+                successful_ids.append(str(uuid_value) if uuid_value is not None else str(doc.id))
+
+            if error_indices:
+                error_messages = ", ".join(
+                    f"{documents[i].id}: {response.errors[i].message}"
+                    for i in error_indices
+                    if hasattr(response.errors[i], "message")
+                )
+                print(
+                    "Weaviate partial batch failure for collection "
+                    f"{resolved_name}: {error_messages}"
+                )
+
+            return successful_ids
+
+        except WeaviateBatchError as e:
+            raise StorageError(f"Batch operation failed: {e}") from e
+        except WeaviateConnectionError as e:
+            raise StorageError(f"Connection to Weaviate failed: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Failed to store batch: {e}") from e
+
+    @override
+    async def retrieve(
+        self, document_id: str, *, collection_name: str | None = None
+    ) -> Document | None:
+        """
+        Retrieve a document from Weaviate.
+
+        Args:
+            document_id: Document ID
+
+        Returns:
+            Document or None
+        """
+        try:
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=False
+            )
+            result = collection.query.fetch_object_by_id(document_id)
+
+            if not result:
+                return None
+
+            # Reconstruct document
+            props = self._coerce_properties(
+                result.properties,
+                context="fetch_object_by_id",
+            )
+            metadata_dict = {
+                "source_url": str(props["source_url"]),
+                "title": str(props.get("title")) if props.get("title") else None,
+                "description": str(props.get("description"))
+                if props.get("description")
+                else None,
+                "timestamp": str(props["timestamp"]),
+                "content_type": str(props["content_type"]),
+                "word_count": int(str(props["word_count"])),
+                "char_count": int(str(props["char_count"])),
+            }
+            metadata = cast(DocumentMetadata, cast(object, metadata_dict))
+
+            vector = self._extract_vector(cast(VectorContainer, result.vector))
+
+            return Document(
+                id=UUID(document_id),
+                content=str(props["content"]),
+                metadata=metadata,
+                vector=vector,
+                source=self._parse_source(props.get("source")),
+                collection=resolved_name,
+            )
+
+        except WeaviateQueryError as e:
+            raise StorageError(f"Query failed: {e}") from e
+        except WeaviateConnectionError as e:
+            # Connection issues should be logged and return None
+            import logging
+            logging.warning(f"Weaviate connection error retrieving document {document_id}: {e}")
+            return None
+        except Exception as e:
+            # Log unexpected errors for debugging
+            import logging
+            logging.warning(f"Unexpected error retrieving document {document_id}: {e}")
+            return None
+
+    def _build_search_metadata(self, props: Mapping[str, object]) -> DocumentMetadata:
+        """Build metadata dictionary from Weaviate properties."""
+        metadata_dict = {
+            "source_url": str(props["source_url"]),
+            "title": str(props.get("title")) if props.get("title") else None,
+            "description": str(props.get("description"))
+            if props.get("description")
+            else None,
+            "timestamp": str(props["timestamp"]),
+            "content_type": str(props["content_type"]),
+            "word_count": int(str(props["word_count"])),
+            "char_count": int(str(props["char_count"])),
+        }
+        return cast(DocumentMetadata, cast(object, metadata_dict))
+
+    def _extract_search_score(self, result: object) -> float | None:
+        """Extract and convert search score from result metadata."""
+        metadata_obj = getattr(result, "metadata", None)
+        if metadata_obj is None:
+            return None
+
+        raw_distance = getattr(metadata_obj, "distance", None)
+        if raw_distance is None:
+            return None
+
+        try:
+            distance_value = float(raw_distance)
+            return max(0.0, 1.0 - distance_value)
+        except (TypeError, ValueError) as e:
+            import logging
+            logging.debug(f"Invalid distance value {raw_distance}: {e}")
+            return None
+
+    def _build_search_document(
+        self,
+        result: object,
+        resolved_name: str,
+    ) -> Document:
+        """Build Document from Weaviate search result."""
+        props = self._coerce_properties(
+            getattr(result, "properties", None),
+            context="search result",
+        )
+        metadata = self._build_search_metadata(props)
+
+        vector_attr = getattr(result, "vector", None)
+        vector = self._extract_vector(cast(VectorContainer, vector_attr))
+        score_value = self._extract_search_score(result)
+
+        uuid_raw = getattr(result, "uuid", None)
+        if uuid_raw is None:
+            raise StorageError("Weaviate search result missing uuid")
+        uuid_value = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
+
+        return Document(
+            id=uuid_value,
+            content=str(props["content"]),
+            metadata=metadata,
+            vector=vector,
+            source=self._parse_source(props.get("source")),
+            collection=resolved_name,
+            score=score_value,
+        )
+
+    @override
+    async def search(
+        self,
+        query: str,
+        limit: int = 10,
+        threshold: float = 0.7,
+        *,
+        collection_name: str | None = None,
+    ) -> AsyncGenerator[Document, None]:
+        """
+        Search for documents in Weaviate.
+
+        Args:
+            query: Search query
+            limit: Maximum results
+            threshold: Similarity threshold
+
+        Yields:
+            Matching documents
+        """
+        try:
+            query_vector = await self.vectorizer.vectorize(query)
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=False
+            )
+
+            results = collection.query.near_vector(
+                near_vector=query_vector,
+                limit=limit,
+                distance=1 - threshold,
+                return_metadata=["distance"],
+            )
+
+            for result in results.objects:
+                yield self._build_search_document(result, resolved_name)
+
+        except WeaviateQueryError as e:
+            raise StorageError(f"Search query failed: {e}") from e
+        except WeaviateConnectionError as e:
+            raise StorageError(f"Connection to Weaviate failed during search: {e}") from e
+        except Exception as e:
+            raise StorageError(f"Search failed: {e}") from e
+
+    @override
+    async def delete(self, document_id: str, *, collection_name: str | None = None) -> bool:
+        """
+        Delete a document from Weaviate.
+
+        Args:
+            document_id: Document ID
+
+        Returns:
+            True if deleted
+        """
+        try:
+            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
+            collection.data.delete_by_id(document_id)
+            return True
+        except WeaviateQueryError as e:
+            raise StorageError(f"Delete operation failed: {e}") from e
+        except Exception:
+            return False
+
+    @override
+    async def count(self, *, collection_name: str | None = None) -> int:
+        """
+        Get document count in collection.
+
+        Returns:
+            Number of documents
+        """
+        try:
+            if not self.client:
+                return 0
+            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
+            result = collection.aggregate.over_all(total_count=True)
+            return result.total_count or 0
+        except WeaviateQueryError as e:
+            raise StorageError(f"Count query failed: {e}") from e
+        except Exception:
+            return 0
+
+    async def list_collections(self) -> list[str]:
+        """
+        List all available collections.
+
+        Returns:
+            List of collection names
+        """
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            client = cast(weaviate.WeaviateClient, self.client)
+            return list(client.collections.list_all())
+
+        except Exception as e:
+            raise StorageError(f"Failed to list collections: {e}") from e
+
+    async def describe_collections(self) -> list[dict[str, object]]:
+        """Return metadata for each Weaviate collection."""
+        if not self.client:
+            raise StorageError("Weaviate client not initialized")
+
+        try:
+            client = cast(weaviate.WeaviateClient, self.client)
+            collections: list[dict[str, object]] = []
+            for name in client.collections.list_all():
+                collection_obj = client.collections.get(name)
+                if not collection_obj:
+                    continue
+
+                count = collection_obj.aggregate.over_all(total_count=True).total_count or 0
+                size_mb = count * 0.01
+                collections.append(
+                    {
+                        "name": name,
+                        "count": count,
+                        "size_mb": size_mb,
+                    }
+                )
+
+            return collections
+        except Exception as e:
+            raise StorageError(f"Failed to describe collections: {e}") from e
+
+    async def sample_documents(
+        self, limit: int = 5, *, collection_name: str | None = None
+    ) -> list[Document]:
+        """
+        Get sample documents from the collection.
+
+        Args:
+            limit: Maximum number of documents to return
+
+        Returns:
+            List of sample documents
+        """
+        try:
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=False
+            )
+
+            # Query for sample documents
+            response = collection.query.fetch_objects(limit=limit)
+
+            documents = []
+            for obj in response.objects:
+                # Convert back to Document format
+                props = self._coerce_properties(
+                    getattr(obj, "properties", None),
+                    context="sample_documents",
+                    allow_missing=True,
+                )
+                if props is None:
+                    continue
+                uuid_raw = getattr(obj, "uuid", None)
+                if uuid_raw is None:
+                    continue
+                document_id = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
+                # Safely convert WeaviateField values
+                word_count_val = props.get("word_count")
+                if isinstance(word_count_val, (int, float)):
+                    word_count = int(word_count_val)
+                elif word_count_val:
+                    word_count = int(str(word_count_val))
+                else:
+                    word_count = 0
+
+                char_count_val = props.get("char_count")
+                if isinstance(char_count_val, (int, float)):
+                    char_count = int(char_count_val)
+                elif char_count_val:
+                    char_count = int(str(char_count_val))
+                else:
+                    char_count = 0
+
+                doc = Document(
+                    id=document_id,
+                    content=str(props.get("content", "")),
+                    source=self._parse_source(props.get("source")),
+                    metadata={
+                        "source_url": str(props.get("source_url", "")),
+                        "title": str(props.get("title", "")) if props.get("title") else None,
+                        "description": str(props.get("description", ""))
+                        if props.get("description")
+                        else None,
+                        "timestamp": datetime.fromisoformat(
+                            str(props.get("timestamp", datetime.now(UTC).isoformat()))
+                        ),
+                        "content_type": str(props.get("content_type", "text/plain")),
+                        "word_count": word_count,
+                        "char_count": char_count,
+                    },
+                    collection=resolved_name,
+                )
+                documents.append(doc)
+
+            return documents
+
+        except Exception as e:
+            raise StorageError(f"Failed to sample documents: {e}") from e
+
+    def _safe_convert_count(self, value: object) -> int:
+        """Safely convert a value to integer count."""
+        if isinstance(value, (int, float)):
+            return int(value)
+        elif value:
+            return int(str(value))
+        else:
+            return 0
+
+    def _build_document_metadata(self, props: Mapping[str, object]) -> DocumentMetadata:
+        """Build metadata from search document properties."""
+        return {
+            "source_url": str(props.get("source_url", "")),
+            "title": str(props.get("title", "")) if props.get("title") else None,
+            "description": str(props.get("description", ""))
+            if props.get("description")
+            else None,
+            "timestamp": datetime.fromisoformat(
+                str(props.get("timestamp", datetime.now(UTC).isoformat()))
+            ),
+            "content_type": str(props.get("content_type", "text/plain")),
+            "word_count": self._safe_convert_count(props.get("word_count")),
+            "char_count": self._safe_convert_count(props.get("char_count")),
+        }
+
+    def _extract_document_score(self, obj: object) -> float | None:
+        """Extract score from document search result."""
+        metadata_obj = getattr(obj, "metadata", None)
+        if metadata_obj is None:
+            return None
+
+        raw_score = getattr(metadata_obj, "score", None)
+        if raw_score is None:
+            return None
+
+        try:
+            return float(raw_score)
+        except (TypeError, ValueError) as e:
+            import logging
+            logging.debug(f"Invalid score value {raw_score}: {e}")
+            return None
+
+    def _build_document_from_search(
+        self,
+        obj: object,
+        resolved_name: str,
+    ) -> Document:
+        """Build Document from search document result."""
+        props = self._coerce_properties(
+            getattr(obj, "properties", None),
+            context="document search result",
+        )
+        metadata = self._build_document_metadata(props)
+        score_value = self._extract_document_score(obj)
+
+        uuid_raw = getattr(obj, "uuid", None)
+        if uuid_raw is None:
+            raise StorageError("Weaviate search document result missing uuid")
+        uuid_value = uuid_raw if isinstance(uuid_raw, UUID) else UUID(str(uuid_raw))
+
+        return Document(
+            id=uuid_value,
+            content=str(props.get("content", "")),
+            source=self._parse_source(props.get("source")),
+            metadata=metadata,
+            collection=resolved_name,
+            score=score_value,
+        )
+
+    async def search_documents(
+        self, query: str, limit: int = 10, *, collection_name: str | None = None
+    ) -> list[Document]:
+        """
+        Search documents in the collection.
+
+        Args:
+            query: Search query
+            limit: Maximum number of results
+
+        Returns:
+            List of matching documents
+        """
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=False
+            )
+
+            # Try hybrid search first, fall back to BM25 keyword search
+            try:
+                response = collection.query.hybrid(
+                    query=query, limit=limit, return_metadata=["score"]
+                )
+            except Exception:
+                response = collection.query.bm25(
+                    query=query, limit=limit, return_metadata=["score"]
+                )
+
+            return [
+                self._build_document_from_search(obj, resolved_name)
+                for obj in response.objects
+            ]
+
+        except Exception as e:
+            raise StorageError(f"Failed to search documents: {e}") from e
+
+    async def list_documents(
+        self,
+        limit: int = 100,
+        offset: int = 0,
+        *,
+        collection_name: str | None = None,
+    ) -> list[dict[str, object]]:
+        """
+        List documents in the collection with pagination.
+
+        Args:
+            limit: Maximum number of documents to return
+            offset: Number of documents to skip
+
+        Returns:
+            List of document dictionaries with id, title, source_url, and content preview
+        """
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
+
+            # Query documents with pagination
+            response = collection.query.fetch_objects(
+                limit=limit, offset=offset, return_metadata=["creation_time"]
+            )
+
+            documents: list[dict[str, object]] = []
+            for obj in response.objects:
+                props = self._coerce_properties(
+                    obj.properties,
+                    context="list_documents",
+                    allow_missing=True,
+                )
+                if props is None:
+                    continue
+                content = str(props.get("content", ""))
+                word_count_value = props.get("word_count", 0)
+                # Convert WeaviateField to int
+                if isinstance(word_count_value, (int, float)):
+                    word_count = int(word_count_value)
+                elif word_count_value:
+                    word_count = int(str(word_count_value))
+                else:
+                    word_count = 0
+
+                doc_info: dict[str, object] = {
+                    "id": str(obj.uuid),
+                    "title": str(props.get("title", "Untitled")),
+                    "source_url": str(props.get("source_url", "")),
+                    "description": str(props.get("description", "")),
+                    "content_type": str(props.get("content_type", "text/plain")),
+                    "content_preview": (f"{content[:200]}..." if len(content) > 200 else content),
+                    "word_count": word_count,
+                    "timestamp": str(props.get("timestamp", "")),
+                }
+                documents.append(doc_info)
+
+            return documents
+
+        except Exception as e:
+            raise StorageError(f"Failed to list documents: {e}") from e
+
+    async def delete_documents(
+        self, document_ids: list[str], *, collection_name: str | None = None
+    ) -> dict[str, bool]:
+        """
+        Delete multiple documents from Weaviate.
+
+        Args:
+            document_ids: List of document IDs to delete
+
+        Returns:
+            Dictionary mapping document IDs to deletion success status
+        """
+        results: dict[str, bool] = {}
+
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            if not document_ids:
+                return results
+
+            collection, resolved_name = await self._prepare_collection(
+                collection_name, ensure_exists=False
+            )
+
+            delete_filter = Filter.by_id().contains_any(document_ids)
+            response = collection.data.delete_many(where=delete_filter, verbose=True)
+
+            if objects := getattr(response, "objects", None):
+                for result_obj in objects:
+                    if doc_uuid := str(getattr(result_obj, "uuid", "")):
+                        results[doc_uuid] = bool(getattr(result_obj, "successful", False))
+
+            if len(results) < len(document_ids):
+                default_success = getattr(response, "failed", 0) == 0
+                for doc_id in document_ids:
+                    _ = results.setdefault(doc_id, default_success)
+
+            return results
+
+        except Exception as e:
+            raise StorageError(f"Failed to delete documents: {e}") from e
+
+    async def delete_by_filter(
+        self, filter_dict: dict[str, str], *, collection_name: str | None = None
+    ) -> int:
+        """
+        Delete documents matching a filter.
+
+        Args:
+            filter_dict: Filter criteria (e.g., {"source_url": "example.com"})
+
+        Returns:
+            Number of documents deleted
+        """
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            collection, _ = await self._prepare_collection(collection_name, ensure_exists=False)
+
+            # Build where filter
+            where_filter = None
+            if "source_url" in filter_dict:
+                where_filter = Filter.by_property("source_url").equal(filter_dict["source_url"])
+
+            # Get documents matching filter
+            if where_filter:
+                response = collection.query.fetch_objects(
+                    filters=where_filter,
+                    limit=1000,  # Max batch size
+                )
+            else:
+                response = collection.query.fetch_objects(
+                    limit=1000  # Max batch size
+                )
+
+            # Delete matching documents
+            deleted_count = 0
+            for obj in response.objects:
+                try:
+                    collection.data.delete_by_id(obj.uuid)
+                    deleted_count += 1
+                except Exception:
+                    continue
+
+            return deleted_count
+
+        except Exception as e:
+            raise StorageError(f"Failed to delete by filter: {e}") from e
+
+    async def delete_collection(self, collection_name: str | None = None) -> bool:
+        """
+        Delete the entire collection.
+
+        Returns:
+            True if successful
+        """
+        try:
+            if not self.client:
+                raise StorageError("Weaviate client not initialized")
+
+            target = self._normalize_collection_name(collection_name)
+
+            # Delete the collection using the client's collections API
+            client = cast(weaviate.WeaviateClient, self.client)
+            client.collections.delete(target)
+
+            return True
+
+        except Exception as e:
+            raise StorageError(f"Failed to delete collection: {e}") from e
+
+    async def __aenter__(self) -> Self:
+        """Async context manager entry."""
+        return self
+
+    async def __aexit__(
+        self,
+        exc_type: type[BaseException] | None,
+        exc_val: BaseException | None,
+        exc_tb: object | None,
+    ) -> None:
+        """Async context manager exit with proper cleanup."""
+        await self.close()
+
+    async def close(self) -> None:
+        """Close client connection."""
+        if self.client:
+            try:
+                client = cast(weaviate.WeaviateClient, self.client)
+                client.close()
+            except Exception as e:
+                import logging
+                logging.warning(f"Error closing Weaviate client: {e}")
+
+    def __del__(self) -> None:
+        """Clean up client connection as fallback."""
+        if self.client:
+            try:
+                client = cast(weaviate.WeaviateClient, self.client)
+                client.close()
+            except Exception:
+                pass  # Ignore errors in destructor
+</file>
+
 </files>
diff --git a/tests/__pycache__/conftest.cpython-312-pytest-8.4.2.pyc b/tests/__pycache__/conftest.cpython-312-pytest-8.4.2.pyc
index e4ecd5a05ba14bc4509a6b106e0056610b91fd10..8047a3d8c967a60ec89cc7b42189b8d2e354b73b 100644
GIT binary patch
delta 3557
zcmZ`*4RBP|6@K?+-|i;+lb_vWce6ivVMG2%0ul@<AtWI|P)G<Q{0LII<ULGENaEck
zK)NBIjMCOWJlX^WiDPF-2B^^0LM#5Dtut-u%nGBdYpaZvYFlepqf^13_MEptQb*s;
z`}W*>zH{!m_nv$1i$>TB&ok>EEtWI^pG~X()M;%zX`N=>?@bjSWbmTV2e(>->G?|5
zUj4c>Wtw8!t6OJ+lUAou@hf(0n5iKu1(2QYcTHCu$g?U&#d(mW3fF#0A*@LE+KLo6
zYBNxq{CN)Q(AZsBta!0MQz=n==rBtuRr2uPcFp?QzcNFSvERPaSW*^wBK=bX8;=Y-
zRxvgX|8hRaw!<#hLADdzxd%}`ojbN@Cr+tE$LHf;T&Dy=0bYb6pN`Oxf<TWBUjx2(
z2?CpVo(aNIfeFKc!UhdtJ@<$8P@iL;eUzy9GzkwFA4u&;=@L4`4Mst@O%#Md<6vso
z7)}N8-ZY&sXwcdW8eI1FYi5IK;WS0uQjCMU!@>`xq_e3Q7Q=>PDM!&AJ$K>wKf(xq
zCJv|EElEO~fc84g-U}ycb2^cp5|+?JI!Y7xE)%_G;=v(PldP$z`7j(a9GzT>Zy8j8
z(Z%+ma2io}u%O6<ur6!}OUH~yC+9F|Lg$vLZj&<Fn7+%V4Hu8$4h*Ia8n+8`g?snl
z8^Cwr@s#bXBz2%}vD%~Zt`3>2cWhIKf+2aU8tUv-<WOfIBr9sSdV3(G2IWw%9PCp&
zx;7(qNqc+iBrRCc!owH_A0X%_2oVe+l!#h7XgR<;slyPLx<cyKU|ibP*QatmNYot!
zy9t7nA-o43FU%d<LmgkIP&}ifx2Ip_AywJf7vKSO!M4O%f83mmc4N}t9cUCZBgj)8
zK9gM4BMdkif;)RU8oRsHo={t8+olR_(!tPQP#H90LcTA2wp&Ozg{q->QKRz>Q)cXj
zxu-lQJrUo<y!vtbSms#6C>y=u30*X=K5F*7npc0x;T;a|55ul~=9tMba^rcE9CLXO
zI}bQV{n3gABhCx1x{J2DsJSj?agD4#Z}F4bb-*=RIo5tUJGywyi0guD?M2(#sCg|>
z)}FUakGY1thusI<qitiM==^0P?hCHwi?-&dxjCU1a(#zA2Rt!{KW2BtvRx0|Hqst*
z6vcAf36qdpI3ehBt^00CSOvRtxORW7#`ArXXU|8T-I@^e7VDLX>4MzA5=OyZ&px|k
zTZ?aV)74-dF3O$GMlXBR(wM0~Qi0OhY}V+|oz2N7c`j>o>CRTmD8J-njc(mbt~!)o
zb}>RXBE02xK-iNDpEqZ~&)u>pF?hv&muO_L)bm7+2^TzQ!cmf|ZWc1^SNKmOqIVY)
zORTWZo3~!e0zXo;R2V2$x;jGZgCSlfhqm=~t4VRwPE61;8M`-Zki&9IFD5kAodM5v
zIx11MskgWL8U^}&KDHko@yVWth-_aN2&#*Abf|ryuHK$&egIze*;qE5u;jvjedT#t
zvTA9&o1&^G_zA&%1P{Zj#WuJ#&nmWvk*>U#*}6oPP+AcyDUZ!t5Sv-~QD&iJy_8`~
zNcfLiY0XR+NJ<mZixMW1%p_SzvI-g1iFA@Ogv{~;SthcCG}nX;rHNJ+smSjWMK6O<
z{~<O43kq%(WfnP5aE`G@VRNBu8l{Lv2nJz)VVz!UAA;8l>%;;Ej-tP@L-1A6S~do2
zihqzjOvDXen><F+<8ZDxU$nExzl#qtb{y_4ox>X7Y^lTa6scu`<M7wg5_W<no<=2@
z6D)wz88z%E3{|*bXvSq!t7ZB1Ex6wkRLgb?my9M}fl|x3k^hRUWP(!!RRpIAWP-&6
zIRw9?G5k-HNU)T$hi=ln!W+8!PjsSW)?D(ZCx^|0IpwFa$Y+pBy(}jS!3p@Xe0tGp
zwC2CY?#VE8QwG<DbdoMP<QWnP+NKWKFlERyIAkk30?~>H8-=|y{jMjGK9JSi+p(oh
z<^5e9YDH(DN9k6-4=>J~mODxwWrFzxV+543d<?#rS<9Z(R`UpT5Uhtav)b8_$gx?6
zm~;+1wm{45-?3w0ue`vXg7+&I<!bwJ993}(7Q_JEzZ)s}`8ilTr;ZK6J#*G&og|0l
z2w0fO4Sx+L=1h}bM{y_Q-uSLw+lf=4t19#+MIzBw1nJtslA2t>*I;o~8G8sqRfU${
z5QTh>Gjw;Ps!)0p8~4Ncs`uGxcy{h`=^bp3KzjANdaAPgEx1x$D_utMNvQeW=h8n=
z`UTX?8~49QYI2p_MylFzBcIJT(!Ik!z~(bxsCkCH2hY{`r4O<FT;y`iSutBXj#e_%
z@>eEl7@l3w!TtbwbuY4y;Zj|L{!{Ay1d8gt(pM<{Hga?QjVxbFw8u%c9sxgKNXIEC
zPJ#17aJXT*gjcBW=g99H7@Lh>EJBIIy`+>0zTE?b%W0PA;fsZNk`B#20J-t1UvrSc
zb4ho7;FRRRG%K{IZ7PuTXz@j4bJNSrl}2OgcnvD!x&XgD$Ui2Yp25PKR*2bR<dK_B
zvH9u9;#Q&>Iju%KgVJxM8tm)s393!>Nk)$F$_(^v<dfZeoIDM}z9qHH3a>0#p?Bh8
z3H}&%Ez5~i-drsX@jb+dl0)Ox0N<kYZtscfIzwB#;|3nsz66Ejs1kQj1Wp1M0mY&j
zCX-IDMa46yR|_OP*uevR>h)N(jid_!XF!wX(*yzjxinkcBY?Q9U-XHQfo0XqK7&G}
zuPp82h}j%?Z9u?nhj{aBb{|+;8geR#^7Y+<lzmID@cTh&nPYzt4TJP0hY3BI(GSD1
zminR_{?7(WvE7M|kyxVVW{SEJW&SbPmKU%rs9rvcxuI+MEvp|PN*c#6PJx#YloFH?
zG!bNzt&cz^xR3fCMkrypg%}II!tUhJ@)IEyAxnhR*7eK}YU{kLt3*!WUy>nNa6g=E
zE!G#HXc8lDx0W&I9-@eGi3fUaSL4#=?%qHMQ|1)-SC+HaV8zN=tO@R1xy<xDInhp8
z9Nt)2DwU&?dN8(?dbE;|MQW`8QXR)ap~+7}OPh~<30vC=>a+vWPBiV5xJi14Ae%s=
zdr-nHyw224gT}lJ(Y9>Ub<Ky6Xv;QhGpnGPVNPeZyVx0+(f%LyIrvvS#xmfARe9|1
z@b)U_5Cx@Gf2|&C)iG|^+_fXLjjPF;M%9eJNuUL#9YHNnEe7p;X`|DT=5#8PD@tq0
yX)V4{fvy_oZ|zmKb*l^bO-z9P)n}ZGQkXp<5Kg2Bq9Y-a_))7qa?6^##s2{YZk#0m

delta 2290
zcmZuydr(wm6u;-PcU@dwEzey+E-WCcfGA2KAYhP~h9RIJHMDWpq<Ho1CL~Q^GL|+z
z@>op<He{KPwB*`2&GayP{h>3}Xb!D8F+~kojWC#+IaBA{6}2W9e)o6Y=YIEmhmSsl
zuXG4I5gIyKqMw-~Cs!vH9u7+mvzl0zBp81X@R(&P)`fY)6E$0pdF5nH)gpULE3J4q
zEY6}OX;CDEupn#67#;4kJGEHy3)3uGTrUJm6TeytR)#0!q-s;h8lk0W@f3KQHcd;Q
zr)|P(;;E%;Q%N8BxW(ntzYPCl61eowVru|gIK{pV*5F(AUg*R{j$YzFJNBA7sa+gP
zd_X=YVU@aG9+GfS?T`79)LtvWh;*e}8V!*mqW%=?^sPxx0-`etp259NHTzj|SR1v#
z?e&y(HhS89O>M2}6KX|Ut4C}klSpG&$WTt;io$n79cW9*bab$;i{VLzZie*?o3JD+
zGGZxHhQ;*fy#)HYlutk&&(L?JwafA!5=OZCU<)2{)yY>RJ$U*_fNgkYhH8D01Gg}A
zA!HPp4H@ySj3W7(gwJIBOx?F;*1|6QBJ+Xh&FpypjgaS=?ZASpB>6W<Z^-He*p1g_
z&H+2l%8s?Z!Df|VH&$i4U=O!Cxt|pbF}O23ANuh^jvX&#|3v0*W+fG;fh3J9WbT%R
zELM?4tYV)<yv0!}!$F2zhC>W0gK=Up%=U5(=YFOPPRi!xnd_0hH5Fep$x4WkQtZE8
zHW6Q+ebmM|y)uESikb8fd$1)Zby^lhi?>-0v|+lXxKT2WZGn;lOc`d}TC(Jpk^@xo
zUg*Q(IXb+E7w0(bFO&OP+dXZKk5qZYnx;li)@paF*6hi}?77Jf<5Q@dwt!(5L#n~B
zd2S)RY@B8vD;RR{i@DX%r^n~^fpVM_cjAY)e+I8%&mE`W4Xn*8a~R)aH<|pQEgqj+
zbNk#4T2rG>9LJ-1MNos6^H$p4<b;_7E?ICIaRM9XB`YV1R^q04!)D`497JD!T0(%b
z6MqVC5P>>zf+z53eg-^@!})2U@30H!+y|5{wjfRUnuJxjpkM?J;f%ti${@+@_*CJr
z`4sz}#-{m&%2}dacwqit$`G*)c%W#X^BkKwRp2x7$MRdmY|-Ft_cV$hNZgDa#qYv7
z%q(##!z90;*OYuLM;mu1j027NRhezZ8KsSML|aRb!3f@4R$~5@)#vf0vIONK(O&(%
zvbm6C4B8Gh)f2c(f^A}mfg2Zy;R{ohD@2dzc?$t%Un1&KL;@RChX2pN?FxQN%FtY%
zs9YubDQ+vj>NFAr2?yJ577hv&=C`7VgNss>YeY}$XBK?|c8TVWTFWPm-{ck#dBq6(
z(JdZWTq*w!y0YXb6ev8>CU&(5J`H~akKZznx4o^^>nWv?5S+*#(&BD!5ZBe>RnF9f
zSMDhU6XsS_%A=rftXL+m@SAvw#OIvJ(&846Xl)&>e$#4SOS6BHaCejw36xVr7?%!b
zh+yC*jKILOnT>XYnY9wms*Hv%Tv(YdhXOuYxkjdy_Dkg*5E~@ZpaoMoW6cgm#?q1{
z3Hz7DU`16Xtj8y+N@C3Hbz>Qm*RzZN6g_yVYL0yad3*W44o&Ly%f5-EwfVTNDmSCE
z$=A>j{I6(Q<xz2gDlW5-xxX9=5F_|>bqZMU&FXBh;b8UM%bz2)YqCgZtBYYeLk2@B
zgOy{W8Dbd%>zfQNpsz$-ky7do>>md^{7v$Cz|NX_aNy~hdA3n@4ie+^Fd~El)#d5t
zDdhYk=oQN|ATE@+OZF?m-TIKnudHfrbNgs24&wF|nQ#J+t;mLW99yx(dW4f07wIc3
zubr->P+%N()J~5-&K4VkvE%xQ(JnCfe*B<zDvaZIwJAl$9jIovA%-ao#%+jZX1K=_
zqdB|j`NIv*vshFYZM|t3#)i7+5aZ2KsS_UC?m9aR;Lf_sFoxS#z5-^<s!xRPv7$ci
zDQ?PG@W#qD7NCF9s-{lgW5N?yTfDFYubDto#w{CS(dfarLPmAIwSq5R;6(W>1)s%#
umdsU4K}(zVShHuoC<F<As((N3ei@=hCC2d}Nsb+rnT{1J`g`|nkpBU&ty;AJ

diff --git a/tests/__pycache__/openapi_mocks.cpython-312.pyc b/tests/__pycache__/openapi_mocks.cpython-312.pyc
index b439d5880224614b8bcc6cae27030ff53e270230..a9e4d4f490a7e5e5de7d572654d7365e030792ca 100644
GIT binary patch
literal 52262
zcmeIb33MFSbtc^V4s-+E02+H^2M7Y-zKNv7O(aDLl10)YK}j%(YLcL^(A7;+XaTmA
zQBInPJOaE7L7N`7Y-I$-${1b}!xK*eIx`9FB$IA5EwnoHKXl?O%FKTT66jdwKg<8!
z_iF1#fs#C#oHOU7M7=Ily?XWPy}Q4A@B5R20+#{DuLu9^%+OVX;jicq`LOa6<I+4%
zE*k`cU>r0I8GDRIIyViPdQ9xs++$(C)*dT<&4acfdyk#fu?#wfoITDVM~{R3Z5?zC
zxqIB~+&1VLD(ER-=k~$EA#ab@XfPS}8wAJ82Eq9?6MuV;k6m-&np?S6#IAX8tsq?V
zHM3N+m|ZQzRj=l%pI!CgYLVt@VARxB{0=?XX3V<#hKEO@ebIrD;Yc_Bwm;T)?%cre
z={8f=eDuhktV8IFhNA;RVcfGk(HA{~U-PcvQT$lXpC1r5^z$C@QtFOz=@$OJYzP~A
zjDi6}W$ZBvC4%W?OOGXN6-ov3%a*T6&-K`ZGQom7b|EN~3)YvdJr1Elu;GeRs1)q@
zbqQ4%7)y^^s1}^~_29Y-zXd{#;KpyEP%C)w>lH#m0e*c#oluD1BB5UJ;<s365PbOc
zI}Jjk(;)vRGzrCcTOjXhv*5?o61f)r3N1na&zFuCwY6s5kDm(<?|S0k;d9~s*si0|
zfx&_3Xz0|47&;vu4vQGd;nSh;^L<0-2E(CqeWQaTeL^I3N*oyq^$mxlheN_h|M{Wt
zaI~{unrt>47L*u6<I*r2zcJ&Op;sCwgJH~gRvKUB5>5o;fI$Wh)K*$sp|&Zfw$k3H
zq0QW#wVuNSN3yQ|k)d-V!{}Y4&62hBihUQe=F{P5*4E1_xO+7<Oj%1LJa{T=MzsjN
zJ`}pQz3a@#P`K+tU!*?_02>H*ofAjShWn$DF0t=)$57vJ-|4W}6%9vlWd!5dcW$6}
zXr%wSNawlHtfRMgV0a+f+ZzjL#=29!>ccxCohV*3WCCSz%PY=IY5C>Tlc%RnC&YB=
zDqL}ADr>H7zOp&7eWo~Fxgl=(kt4W-Ck#2GZNmjN+OOc`GL5g1>f|1RQ82w}mPdG_
zVcZl|M(r%kSKcvZ`kK_rxLF`#q0A1U_?Y3-X8HbMLxW+hA!58}G8&E>jQH=BqUX)W
z4Hu1VmhP-kyk|WhJ=L)VnC1u%_m2pKmFBF4hAZnn8yOkKhzaKh!&wV~7-q`cKN!hc
zXo|A7GkwFtU|0;GcM<Ak2!~jLldO|KvG>%#U^rHy9bV-!)r#y!@uJ~QLD8$nFCCwV
zB%X>NPZxA78jQ~NnbO<E)eFV-sp9&?rgZVD_@1Aearr0S;)(UY@qFC-b1VL0HSa~7
zXy)^!+syyYy31_O8GNF!Z16W>xK<u~d9Wgd>aYu@G2@pEUseYCSB#iCiDIKw<q(YW
z(`W6<Mdd_LCSu$)W;p9mZYU??<}uS=!!vCL!?-2tmM@Q)qaOKO1`E+LW*IYIFp7my
zuY6CiEbFCt%u<fq<K|b|Er$EI81Y7nl$Na2l3@F?(qnwF`LLnQ-W@YFbj8Y#4oA+P
zJ2xUm!$PQ044)!uG}IT}7P@Ebid7#S?mG!m6dehP;mF9~g)n|kg+;(rcv~pudQ$!)
z6sryi140P=K&gp`K(t0q67IG+v#v<APmD$`4gkblAMYDHAKoX5BVyJz7>SAl=d#ww
zIZ#89#vtn&hzty)K3*dd1ZEwF!lS&p^T_Bq{$!g~^wT{vx<up$jb|;xBLaY${Xw%z
zpew<yTl#`tRF9Qup;vRG63;|_69wplxA@ghUHa6NaLe0pySOS@yJgltYfV<~Ocy_x
z^gNjH`7gUBT~iy<zR-fNIpu3kMAE+YxHS_9UOqT^FmA~N%HK1Xoi*{jxBb;q!t48Q
z`B%?aX7{GnJaoIXCRw+0HZmJd*6vN0?o0aiW&CARmdS0G_Ac7-%w31US25N2y8V{7
z^>%UP)Y)nOv^ClBNV4isy7<wg=h2MUA9sso=xM(~Qt$^27Q>7TP6#tzG>(GIj~Oo*
z#1=rR4v`u&3Pyq~8QuZ820dmm28e#sBtz|CkRv_38B_4)dE>Z6G>utUO&uHpgHl>U
zT`THZSzW^WyhB?TuxswVXCYX<4!L5u5AuaoT!SaF4vC9~v;JQ2oZj&B0I7a(g9`+1
z*~(r{*?J@WXTn2$#E4D~40HJ<TZAVV3l8_59PNz)$l7cizHGd@xPiSw0u~`#nAdu-
zra8b^<osYXLR^A@AcsM5BmT~1O!7-xaVPRB3ILwFD83WmuxK-QiYGpva#v=`Di_LH
zQe`dEw&@Gk3)5wr;|EaT@{Y+JiQtT7Vn^D)G3nWe2WsjUsyC*pH_n_&SMNx=cf@z1
z$oT7$o;uvEZ(gX|m8#n{*L<@vUH5p>jepfBGybNerwJ8&fdy|<%G;DUH7%sQ>ywW4
z9K;mK03B37?2qsV#9Izr!KeaSXSKCahmL$8I}AaX0cADrm<aq{`rsB=JsC{V0*EBQ
zI)oM&X%s6zun(-BVAX>AVZ*4o%@*6bKOBYR#o;By;6)O=`0R&TC9!OENC=<m!{n|G
zg@?}%wRL9g(w(eby3?Jt&@GY10kW{Ae}n`RAsjwOXKf}1R^nFNm1G{qT*Xbe5UbS^
zCLJK&PEQS?0E2Z0rfey9&20%1N~fKvx^-#)`lM%lM!J{SG~JeJ*pO^^NWWGQgRg`w
zap5b4Y7N_KH8V!FEwBGRgyt*givk5D_a`wb!YlJ%z5=n4ph7UyT!HXdRKg>GrD5Lb
zT{?^#(7@(b`>s)2n?2TbfQdEWNu!USS{;InN<V#rgO8sINpq~h;7DiI%4%k<tR|aG
zaXmVN>-0=F<f%fLprB^&$SH>2nu~*jxY%Y^r<;+G2+?bqD~X%&N311h(pM%@52JGA
zGzyyh;)zo!cNNIMg1<TCZ%$m8KK<IKXDw;}j-+QtM!n6bMCr8swc44YRNea7Mj{uC
zgQ<0No6wtf8gRy6_Tq&23uGMdOvW=50)Si6!FYyIp1N^JIxiYuDIc@+Lu@?^N&;=t
z9IMk#jP6vhafgP<23ThM_K|Z;^W=2d#{bGX`!UM{q<BVh`M<ayeTr4+jWnOVCvZPP
zG#-OnT1}k0F8**PSaq%7N<re(%!a9gbZ|@jV8$Cvc^fljp?P13SasbZSao1If+!<(
z7EN9@4A2<SXtk3>xB{A30O;yySyicZ%o??z8Ft8{88N=ng7LM+Ag4nr?64S^TxU|p
zb4Ac*;|ahdb|gYXH83Gd;&<XBbb&ED8)swUAzaBiPC@-5wR0I)JAm6Oj4VTeW4IsL
zg90O4*ATa5`0zGhc*`m;k57&#K0ebpG0xc9ZEyKh>+Ab}<XxTdl}@#$eD#wy8s-KX
z=F)h<@`0v-VIXPwP|5(N!7P}b1HToESE4;y+JV|;rM51;$*XNqYJY&x17XK3SXu2N
z^h8(eQMn!J+E`uVs2%4H>D-BP7dtlz?!y2xh)14S<9<n&;hZdVvM&Pheq>n2E)s7#
zvljZv+PH)cvL=dsqgfkC<HM)3_JQGO7>ah*23B@5EE3tlvG`!tesW}F5UTkR2w&$1
z2fKlgq*iBrsstr9=~b`r#x+%>*J#8p>4j~UJc5~ZQa^i1(92av#VvSktU3p!WqC>#
z;`&e}LOcqv7pS=W$mAna7t(>|xRbc2W8NKN1hh5fZ=Eik38ej-lAcY(Jni%DT6U`?
z<%ifc1G-8g7TvnfQ_gvJ9eb)R<!_sAPW#s;J!{oxO6gRp0}7IOc)n~^JeqW@n=zqS
z4%!M05$_Ays#%6;jGl}ym`*FEgmDXKk(RcY_1LIvVv_;zd1J(FG-xQ2MZPm`8?%9~
ztpXJSVCubn%&zI71E8*l7>+T!YAPACj@e1ld1W=In*JB5?{|(l#nz~TK4Z=(v(4gh
z<(tLem^o6q!ke9fRr_YaN^d4z1Y%*8f=C>sxh;;13!PaPEK}#gVss!J$vVXFC(jRv
zVSx(?fj&VPApX=h_=H-?{9JexWR{_eWpE%8&026Jl23?Tc^Dv)Ay51S72Q+_RGdVS
zbyE){eJ1Nt-x;AH;F<@OT);ezYq2VQbm5;DL5;`^3Sdh~<>j8qo`h%mWV&Q++?DZ{
zU*0yk4Vq|u+TRg(WQdag)a##k<nrT_kEa7oX>aqqcgvfN)6ajc6Uwi@>^+0Y`Cxoc
zrlRp$=ao(<uqV?MYvYG96*bp7u5?VhXB(zE(iJ=74^OQB^+StRR9<u$N~`Ft$<U^B
z$>zB0ZFkAlRf(Q&m))w^dSg|lDs=6!E00aDn%y|{Sh{K#p4@opu{++9`?7@|e9p=?
zA`N7ID7}}-Fu*1dZ_8;T>7ubp1x6T=%LNhZKr}oQ;SATrCSEJVFeQNVS~pdcXVSu+
z$`fGdLt>Ts)5qTYt2BGW(@BD<x_ox>Y@!UaRoW4E!(8y{_@(iw6VuW7c-jlAW~QWk
z;_0}UbaYHx5*P5ZocxfW$~fyMaI*3cDuh7gtj19~=bX?uYSrakCc%k8G{HFK`mzZF
z>5jE41Id{~h-^iYJu1|XMTP-^*~oF$nYD2{Rm@4UUI(o*#LCyLS+}8M&073BvS!UT
z_OG3lSqs&Qxzq|-3#~xJ8rMii2mN+zpkfOZ^rw7e&F95|nEy;PdM>i9t4mV%I-xDZ
zY#mHhglI}Qy_|Kqc`tj<fVt%{uM>D+C2Zv1{~M?gA!$sV&mh^T-FMujQ|<Hari{Nc
zgVScl#%k5mt(n&KGw0`9w<o=gNyo?Lj?6uLvw5xyr+ku0F_jNxl6T|EhnQs3nCT_A
zh7Tx~R8r{}KCD)zQR3))9*1C;A38sjJCV?yrR(pI`T*US(MB_#%u$>~+{{&+p2n4x
zc)#@C%k)qq3XETI@baq3Ra3{)#Vv7rrnWg*yY7|9#OB`^OFFjB8c{4C84I3d;2*;Y
zjf_BQC&zt#o}`S0p8ZTv?(Q|bYU)Qj{ibKY31LAtL6*0TnI=uII4!t3j&URniOw#P
zwd?n3!m<XDzJ(RADp(0d&WU6<l1C~;wd|2Fm(posWzwH@_cH4$TZ73perj%9#S;;d
zsmKQ9o!H9M%Mz$OE$wf_UW?5%eD%`{E!$Hq+h-4_TXwzWeQav~_n-Q#ect<6((%|Y
z@Dp+1;p_G-mTy?LSaR%=#PQi!{=<DF8Cm8Shh>nDwO|_d!%$?p|9H~;Fbz~sJXh@A
zOzR?pT;8E4c*{M3T=TCDhNm(7<5rS$&bsp+#-FOi6Y`H8`fbIS719#sPcV&>w4>K6
zhe9-+(E_>6F{gZ0b4`(Ro`b1CG`?~W(wj>#kGs{?f-&cqMX<bSl~;7pYZ#YUuRY@h
zW1h3hYJmJEEdAN!cZn6KL5B3aL$E6~oMQ!Jt}&0`5S$eTCYP-p^NbZxj{v!w1<SbG
zXc#s^R&(R;FOJ#AT&DoxT*nunl$;{U;OZ7H;2jKrk35W}DW+=lNADS5xMv&}N%nZ>
zf8l6zWvzoF7sI0XJXNRJ73mAaGgNT;Fo<<5a}4m`gln|MC9s8swn8R3Wo<*@=$R2g
z4AEWJFs*0|4#dJj*4x(~J>NIjD<etP0j_&)5X>R#B2i8<20NAWY=K;X;ZC+l`BQ1a
zhSi3?p$I5hUlfLAA?Fb>ie+;CPPQmfh#mneH3wf=D?BwYEc7a`%~hv!@4bd5A|c=r
z(6p%Ra@Azj=W3u-SA`M>Q&k<4hiBH$2L7PpyA^YLey=vQ{s2U`ikgLrRjG<q)7#P&
zo8sO~W9u7-UOTkVxG~kZG2OWNJwuVRE#(Qt4@{iR1naLAUMWmmNC!Kau_NgXWqiR*
zRpS>QpEk!I%Y+&iLTgf?H8a)e5Ufbmx4p$le`DI)^rnBhH{G^l-n)b9H?=^!FRh60
zzumbuxo*!~Z}ORww>taZGgu2MQodCa1ye6%{GkPZd&=KFz2}yH&CD|k8xN&69=f^b
z*2X6?>vl{$JhfxGXnI|;vU5Jrl_{xDJO?>6Q`0c9|Ls8eq8shJ=P~%oNRMhxmbK3N
zS{EDe9gB@H$4opK$6_KQ>D@VWh;Wh7A<|QR&9ySW%aIFBz~@TBXROnK1Ar<8R1O$b
z@Ow<5HK6qpj~%xFSFKJ%RMC0H6pS8+V5F-rK|@oXC#r+K<{yHl&ab=F-o#y}U;usD
zAwVaSshGNqOcY8i8nf%RsNnlB94{E<(xY|`!SSZzWisxBrsgE<ZZJfN__L$YAew1e
z`jvAR4bq~tt2^t2F$tal5$H<hb!*nVa}#y5c8GOR*p&LUpGcf*J$W*$!O0hlhYUty
zzlLW(D8U+xmrR%h`z5R&kZt&187~{L`t5}=(eT^mi^l85?(5))SySg4@lo6tzkos#
z9bRO(cF(!}G|VH<pA&b+I<(^S$@2q)0xjLJZgy@T9O>^HjO^@Gs{fFhYDMw>-x=P2
z(eR$ZQBZg%Pz|*uP@S;DP_S5FC<;zFf8?uw*Nl6=U?ShY@Ru5)CivhSgViWTVY+Au
zJ{Htofg*>M)}eNG#}y4fAMFBN8W?6O0%@1LS6q{jRY-gVR7fZbq8O!bZKi@WfHpT*
zAur*a=xkr~d_?>#{ZW8bSXvw7*RpQ@i?uMUn-<D%>BW?Yqgm@vSQzNzJ+MpeD11B#
zGE^G&kVM0B2QZh0<=*=)o{zkR0>g;mE2+8s*yLl0_GvL4SQmF@f;CVc%Uzk0im8EA
zNz0{uZyxz}<IL!{y5=^fI}R?I4bD=mR+Ux6-HRr(v*>n3_0&+hVs-owu2wW$tG-g5
z7@s+rF5en2%oK+fiW^hKjfvwkrgZW8xc#;-uw=sQELtq}#docAR%|FJS}JiDx#HG$
zgNC-wiIU6ZljT!eZWT4oYyfR7F1_3_*^#hK_e^x8i?=|6^j1vmPkI}Yj)wQ|Hes#y
zJ%iC%^tQ*h2zQ2}dlBMSzw6%JZ1{e&bN4#)_tzRx=1?M%L>MLdJV2koTNft*?gPq-
zDr6kfOFk9X;Y~m?Dm!F)5h+nA%~=H_<yw$d6dH9{LzC`b6OxljPx6uJ3*?QkDkW+9
zXItJsaf{}@<*Xw6XnJUs<qn;vX}L)8lF&S38RLsSHhCQ2Q^D*wuXKOFcqnp^^2BM#
zF<7;3Gj)sW@QOA^o_R*xg{vZ|OB#u!gh&d+hj1_Rg&6{Blh2Kvqv2{)&N@df08gRA
z!cBn;vLvMd6$Ng|vGO%XViOW#ail8BZJ3-Fax9+9ZoiEdBpVJe%NJmJ|EWa()H7*s
zJM?~cAnC4p{gLVDx1YMzxI<p_gXyz5>1n=QRC2j`vU)0-E@}ka1DCq4bfqiW-!s^q
z>n}YL-!oA{7W$^w%Wiqw-aI>7DhnEa+H$M&$qbgCYqq3nwqyboQ|l)W!2@E+YOXDw
zuuVih>%QwU)HYljx-vAqFI}^aUt9E|-9_IDrhNrRNZPq<_@L!o8Eyzq^rUVbc(uS1
zs&Zzl%EM$h0=%mC&3ag%@^hW1310PJT=M1_v&!$mN{)p|*4-cQl?rw!PY}Gqqemol
z7XX(Boo%?vmUo!sEdCp+#2p*NX}a|W70jx5lFoh$#j*t+dMH+>WtF*5CqesvrDsW8
zf6;)s2F=umB+EyEq}kFr^LH!f!s(hvImG<5ram8roM@3iU0xo76#;8vhI>VlKk5mn
z%Bw@WhDV=)fhL4IB28%)t6S0Y;;=}(3^y2#no(8!w^Ze~>8g>92gVEfl;K`*S$m<e
zP&bx`nFUY$Iz7goCAy0i=^@sR<|=QBU!^s+{HJUp8GP<J$vAw1x~$tauO)ti8pv(s
zUZF71AJu&EeO~xYJT85kZilG(``xDxUjCURh{)rt42kqX7~N;k;>)PQKRl$I(ZI#J
zqUYiHdSaz<hVO;)an#f^9Oi8zi8=fepspM4!PN|IA$)46-Fsf%F6=@Q9N5@&^FA;P
zn4uQb$+L0fARyov!p_)z1{h`JXi6(my}emiujEXLb5C#YC!t?TckI2r@YU_@6-&`h
z*4;nY7l}xkX+5<}@-1gB<om&V0oXFNc!2&SON@A&iXJM+UMN0I1=ENp=<IbWh^#TZ
z7N_W}jEWK}2(VdEfRo6dqj=fyw&l>0#cbUOe6bb1XEIxZOJ<xwjKZ1AZ4KP5D7J1`
zYIRrxO958caOSgHOP7j$*7Zw`KAbgLtes09m-R{GQqXMOw&XHfyNye(QfqK=6I_rM
z?KRfMJO0K+D}Eu76;-k;SiyCbFFEPj!$w2b`bB$@we(JbZ_$chR12(TSEyRSl9R4A
zyHTOAcF~Gos?fA(r!!Qjyz9gn|5p0Ue*CW-q(9&=E)go_d6L@{PjY*%C%M*VTYC<p
z2lFr=wZez7SfYWC!QJ?9SiCUMAC5h=8@xQk=9YPKlRzClb$&2JKFOg7uNA=(Z2xmu
zgFQK__2iDg54<x+ETq0Ov2Z8r`wEL+ibx2rZLmgujKLLE_2C{hT!#SDh+9yGY$7lM
zK9&xWJ9^KHgYdh?t7XIC9BPR-P~@6e32K!E2hArd-qint9w|owOGGeq&3nZ=ZB7SQ
z!-={8UXXFiXPn%ss&o-mE%={(AaOgAdqwLQoXDglY^<ojp=<?NSmy5p|KNAOj~`HI
zG7{k@gr5k#D8%I^Z?9tZ;a1Q3<#X4WSI3CwBZQeR8h%nylW3f7_)2>`l5`x%GpXQ8
z?uU^HKoM4mN-%*QzxjurAyezz$c%P2sOh#BE696XpaosUz@WB9I8O&wPavGbq1iHE
zBsCmE$8Y46x(lv~;0saL+WiixAz7Ocj`j@<##~2-xfhZEH{cMc`3<xu63Id2#yQx@
z80CRv?5FE5QxT$@7SdkDSLoDAUg8l(nX|@TW*L?hMoyjTP%BohGb#MdR+@`vPzMTP
zu_0J>d317gp{y%a)-_{;ms8n}OP;uMf)>{y&Sw0jQ^7>fjO{y~Z+N~{nCyCR_LFmg
zIa{(}e=>L==|7P49H1qz(MzKX-j<ZNW!jncu9Mf?yRTcsIlPIp1NNyzQ<gC?cK^CZ
zmwo+!o@Y#izMh}`kj_XJ;Ed&WaE2lKUApicDrTwpE)|SFc!+Wg^h*rl59vCMQ9f1w
z9$lm29{!K?p&+XM$dbimEeC0|6~AXPS`QkDtQRk`(?y%dx}NB8V9`!z4uiLN(Me}6
zgSTbTO=liMQQKkxofR5<{zWgH`9QDl7U7K3S$bzb{#Op5F&)OGQq0w_<x|?qxB;dp
z)5{(fw^Nl%Z3T;96>L{cT1typnQFxB*bvQQ#ea@vcWV&AV?%^bEsNlBB4URkcwC6s
zp$Hx~B6cW($AgF+ir^{0FGcVa=DtJyOK4<0^r44d#PbxPu1{!2Tn|P6v>=j)qJLUh
z^p0O>6H4%RKv*S|;<p69W%w->+Jzu~%Y@ZJIevpehfsmv^0?u7V^0Mzt24{uP@W2(
zJbF+=LSqjd&S4Y%edi#HQuGfY1gjl-Zg}M4U|2XE2FDOWgifIm#YCOUH58&ci23+}
z5vmfK87eMeS^G1fAX+M8gh^h@E7)JsY*JJZ?oo^EV1FqT2qsWNFHt&nu*e@~xR2S+
zgVS}aZL?!x>O2t$2GXux<s%RP#3(|xSiJ_T(|MTx#B2e(r}<Ozr0u0vft`%Z%;BAk
z5M`acy^P=X_A&z-=nA*&v6pi7IDfzuo>c}|Ws6+zzi7DaD7a)#If9@a8*VvTGaEO9
zb$K&u*RwF7`i8jWmZLUPT|>VWnd&Br1*+hbpAP^pmC@ghzqM+rYU<GQiI!=&%+_QT
z&ctka@Xo@Tb{_IW)}*T-6hr5@tMKygR4UZcm(s|+X!xnO`12bsZ=Kxwxd+nT+N7hF
zWAsJb?8aK68#al4$Oq)FlJzK4);l05c3FZB5+m_zT)K^x!Qsp>izE1uF>Kt*KPb$G
z7TumV>hUDO6hnLcCQXc*L2s1wxSuBc2Ev0Lcaz5!i*{DM1wI&i3};>WJ?2<~uPQOZ
z0Z31A7Zl??YS9v(bqogj73wM+me&QA>9?sE-anw8vS=vRJB@(Pt1cOSsL%MSLY=Q-
zrUf-9=xni09mTM~mg-{W=T3Go)V{Z>p$o1KQczzP_kD_V9g?ZjQK0CPvUU2$Xjmk$
zVjdTLSqr#XU$(HXzdsy_0KZ{Y9vQ>}pJ_nI+6lP<V_bu!ClNg;h9Nx*y?xQF>-;%#
z+MsjsC)Dg;Qt?+*5Mym~i9e$A8&uGAi?>l^ZTu;5fv)(dNK>(kirpw=iyYIMS#SRz
zTt&c<0F(E?sR0lpD>r_dqLB#M2_&h7OO?Jb!llHpO2T4I3c=Qp_s;xk4ZxVl9kd2%
zrqEDYKVPyp5t-hw(7rp>zB{>UPqJw**6AFc1xM|?qc*WN<!Jm7NRKaY**WQ4@U^FW
z?a9^0(!S$}FG5^h@1@>!K~3D0aTL7jx#YQ18p>4GE>w1;Dm&n@oT*(kU;F5E`0E4L
z2WAV>oe$%$oAsHR5d8~QUvpk@CYsa1w)tS!^pndk)VI9R_F7wV_4aiAj`{jMbH$nR
z%6CiL1%-Fb1y0vum7xU^{;S?g-YHkg(QsSxEIOKI)^J8xV1W5+8dW<{{Cq0n#2rRO
zPGU^{ucsokH0S~5twc@qF+PuqfHHuJ2-d3##rQ|WWm|WQ$>JQFW6iqQ{4gf!F)RTM
zDws^z22;&X@xv$6L6b>_4UUL^LpT1GD!IhB=sXt@#lNF#Di+?NKbK+Qf1|4eD&qf3
z#XD5|Jr(~2#d7R(bMn9gP*q7ui+GwE4-(E@M?)Ovs^?3#Cz_@$3$5Eyt=p0<4<tj|
zC7i36cT`OEr5v?j?|C?PB<(x8GS1b{S8hoN3(Z?n&0DZUz8ser&b?b;C**Mgc>;!p
zRv?f2l6&G2yiX5#aw1)c05N2t;r=K}r5eA=B2+DSJnztBn;Ksh@`fZ-%{vsvy26?e
z#7q(kz#0d18MB}bB1b%kV7{s#1Aw0VL@eF0wv~Yt`~+;FFBeWN98MXBPyy4Xfk_5`
zj2{r2V9+TAk}%NAI*3tG!&ogHIWHpalz|`#zKj8I@*n8s%b1L=$xp=EbXkC2)u#v~
zNg9H|1W{WM$QJyaDSv0Ot0(P00jF9lzf?|EUap<2O_ZgJ+OPzZL+yP;b`hPDDX;xv
zRbt&ja8)X}YI@Vmx^!?8r|<7Ntpsa!z#3Lnf|3(N4om@_I80GTJ_<}}po6>sOH|K?
zvx-W9CZz*m5%^j<VACOc&1IZIr)K<^&4fx0q!=k;#SH&*>`>VPTCY~5(ik)3ER%b4
z>V#>WyU-fO89dZG>0R(Oq<jsDN7KHwK<Ad#$(AjzMA_09XI#5yg`{IQm+eh>P(BC%
z7y>?vlV2mvO8O{+A#Q|zYkZkpytGe9PwL67GV<uTW&rR_-HNzPjnJ#tlekUxE{z)m
z7A2XP$Vi@px~s-YEbk>Ax>7!7)Tkmlv_PG!QzprwVgnp1jLf0J#00eN>t-%bDYFK>
z><W6Oq1q%=<!NMJ#HH9yT?AoXP0F-Vzy@&_9k+|;Fyu?5Tgh%0mV&~c1ezuuNmw)f
zAYswe$J74CY0JES^`g~KTy^!xwP&t8Grcigz4n%G-MePg|HTr0_P^Nj09-M|t2pIw
zcm`+JrGQM<dz#76Cpfm3>i00#{t-TBK!(Kkp>BHpOD6Q?PFu&<Yp>TXwCzl_?M$~l
zbk~ZDu*JX!p}_8QEn=<J#UYVURXzyC7$iP{CV{qOCYA4LevwGPt4=m_GYbDV<%Iw1
zKF7UjR&=9OkQo}CS&wxHW;MhFgd9;*WEh64t5tG!#h-9^($&UPt!m69ITZ%StZ;{|
zWbUx!KW?V^ms`F6GAxtENLS4}Wb8vL%r#(CcCxj?$=23=&!wm|p?fZt$>0>s69UsV
zIDcW{j-5l!Dzq-%MS;Wy;izP<U>K6MVeuaxiA*7Z2t_Km$VeLrIa#Ly^5T1RhbA$9
z#Wfq~i$?qU&me*w>wqu|agj%#(dbnrOL*jUv<w31E}M#8`}CDhr`(;liz}vjrag&I
z&GaNIA4(VRN_uutz5+yWBpyu#*249M;z?Jh{Hv#*Lc|j|lA~zBQI&F3O+A%3dCSq3
z>Dn?|mg?H|R&{S8I(OuckKH(SQ~1MYlTSUH-uLVmh571USY=yMkfR($?03OYmvYo4
zT5mbpGxg1HbiLM<u3wKjtD)!o;ytUO<`WR0(a{@a<+~d!H`ZEE=CCVrrD1Tt3Ap)D
z*j0`Qr0WnM$DZSt#~DkJ<gmGu;FWif#Zq3bSHq3;tq8i$Yr>#p*7!@c<51lL|F_z4
zE^lXrFL!~~+y|rNQCZ<>_lJA>ml_L?N_FJ15DIc^A|z54c8hl~o2oXW+8mg*BHzHE
z$dC;Aue)>~{0X)AmsI=}6?xCtHNq#;g>pq6MjXIW8F8Ss4)LpKBv<YUszMJlgetCy
z+--502((i5aUuqPf#yLB;FZxf*|t#Jkt*&;cJ`!;Pr#YY;eEC65<KN9r}j>Ekwa~H
zs;oT|sGd5N3N&RZ8?WuSvSYe>)|9S%;5MiQx$3pO(eYXbR$@%)`Uld1?JHfDoHY)9
z{juwhCAU3tb9Z|6<LR0w$gzlGz&ta;cSgQ3lHRmGU2#D7;_Z_1%g;<cli2#kj@Nd~
zl+D(s8+N2icETPJblo+$o$kdToPgtn%O$serW=@X?IHX#-B5-@_^@;%)~>6HDxv}z
zP9lmj`cu4s+cQX*6cuae{ppK{EPn>kNrj7072J-LPA-I&Yp|Ns&WK6{I(6mH73+V7
z+P;mpmyv-J>EfpqGH|D~Hes0@0oo^yrz*QL!Ma3qD%h5(ZM`;rWqkUX+1=^d2X9Mx
z5eD8EdTnUtVO(o|FdckorOROaL@u1)DfmV~a%Xq)i6_%*4yWsnWNKQNGuNZDjepSf
z-LCYuL-6y`y?DF4nz{9kzA^sV_{>wYClP^^F5jJFmsIHhzLXuLLMbMc)woJ)W8g;e
zeW@D#s45T(^r1P(J5+f>Pq$O=Lgq!fG9|nVF83_F%g)2Q#vNGQcObW$slovJz4<HL
z^}&x`>Bt<A@*Qy5m3o8qef3F;=1Cnx4SP}v34*h)Oa7coPOJz*8b=KTG?3dXLWgLi
za43Oib|w=u|B-j-?QkM7Bhg;gbYZPX><U_x4?kiN6+c9U>sHkdK>PtNFgE~p3pV#Z
zqzmM!A-1AWGchT$Fg(tMb0cujieyXWtSZdPqFfi}>G3)gusAZd`7&JyQIY#T@mJ~E
zD2l8@j?xj|#-F)S(bAeBwaC3(mN8WBiEs^{7$K()sBmyaD6Lp1X-k!~O*f`Xx?n(T
z-?-5JK&t(L**)p@hZfo&PPIQg7fH7tddvS*!v4dHpWUDIKNWYNzzV!4FtK~$WAW|t
zl^f^X8=0)VKILBz1UfJ$r2U7I9`ayUYptDkuVuB!NHl$6=J~mjw10onv;Qt~HI-bt
zc<ECKq|TT<a<e&k?3wtd(%xs2j%R=IUYQ|q%*a0WckH{1EdSnuqThlqkPn(|%&Kvz
z5Z^|+q#j1d`Vtb@N${70B~}>kIPBJqSp|y8sKzfdI7A!>;A0ZC6a(x7bW0E>cY%K8
zHvq2T55Qc2>d^+zb5X6dVP|(J-;W-KDCS04{zGfj#?ycS!YV!7fbmj`RTS7JxVQ%m
z;*eXUgft3pc8FmL5feg4-HEJE5}<Zw&HMKq*+~`y5zC;4cW8v!nb?mrq&$86@DVYH
zJ6RhyON;-JYWxw3Se3#-lm=Cm6PC%FRP!Zj#@kE2pej{IrZUOMt@JNjA)^d=bzv2&
zU#%`HpbS~CuE~)l>)~!Dz08{@TOgqcUxClpMnyj!i>=Y;HXKLP_o;~dyLc)>Q;hK2
zvg*rYlVhLzRNQkrSUGjzO9k-)xS<r3Pwkuc)Mb3tiPDs>B~w(BsGBcpNIXAdeC>sq
zQ}Zp`?~po5DLB&pwxp+xkRv#?30XE0Lo=V8Z{9L{Y_9LSCvF~?-*JTD3Cp|D_*<)H
zkfcCLiRLMv+BNU4X1CX+{Oe}6&joL8Nc*2idY-t0ypzY0wL6l5ok{P`q+=%+Bhhi?
zP|Pkb;?hS^KV{$sJ1|P@08|SBOuDF`+E&3PN-T&99*1#p%tTIIQY^3$B-s?Jd=$_?
zX{$8;A+%tL92A}6=g~({<}`k?HXcwQy74u*#wh0B(+$hX5n(h($Pf|SW{5TFPjD{u
z{TWT_4m5*F-Tm+%cire(*nKRu`&fE+&s*LTvn3Oj1z$(X*D)Rbk#9rNdm?T@fmDhU
zd*h=?NAMT#nGL?Djm${+<=_Lknm%DFqe}D{EAeR!Ez<RjBd<AGAC)P>2R?&b1^Lf_
zClY4k7&i$B&SoL3_E_~Ewn8213k`=a=1sw9Cs!+(I;Y5fFfXdYpfo}M70q&QGtvs>
z+4(A6r76mtoGO}}X8p;@rv&pfJqOVQrU%LVd`&4|)9s?b#8a0~OrA)TPFJQ&Hl~X<
z5fbjdcIe8X>4F(CU9~M8d;o^iqUI%onPQ-Tnm+%;zIZI@DCZbqL6h>K2vh=IhG{~q
zHlzuj)k?0T`PFrKRMvdRB={oYnaLq+%)&F3azd=GF64-2MuD?~AQnt{5+uI>fku}#
zC@u}mHPR*}N@_rl9n@pN%@|AN3QPjnCwQnH+$vNiBaH-@j8Q0H&#yvHJnXDVX}OU7
zU5%DCBO#yan=e(cH5x{}Y(#t#ODc-3kyw(#e7LKzMD6q7kdXr7NZl&K5smm;#IhV5
z#Hk>*#K^@vMBuU(lC|C;7M->2-S_CeBm2k~bTAwZV=bS6_DHN+<ya%K8=8h?*)$6~
zFW~_ZDasAmI+-ykyo!5zDJ>uv^xVif*(;-ldZjQaZZu`s#C(|u@Sqpb!E__B8r5T6
z`j{c{rR5AUi-#ir1x*oKs!bRtUx<4o8|XryB^79y_M`(FVF}IgEcHx(YPKiYa3C2x
znDie^dJg_n;bV*^L7odGo|);JZ`w@GsFsD`rc`j#%xF5eE9oaQE3q!li4v{TYhObq
z<oSA31$*0?@^778ebbTr*pokSCyzdx{Dd(7iL=QwXVd=YlAh-{&)YKZZkR5ZEt+rL
zHv9Zd<9A=Ud1n5>k7qo-S0BIh_=2Z4<*7xg9^n>JKl-aAwze}FcrfXGFzI-ZBe7Nj
zBQR#P_C=hK1PEDfGX@|2@dSF3H?c{Q$|zGBhAsaf?LnrJKnT!D2KFoERm-U@!2cc=
z3Ffuj=8UbD0G!}Z<K{>?%M{Roq$KgVa&+dMFQ8z;)V<=zShzofMsP;t4iKQN2m*!p
z3{lh_$z8GF!#QnhVAlkl1JyZbMn_a(28s%Af!|`GeM)!a^<xIKm+%Ir7;!ru4YdYP
z+tJn7ruzb_(riA0yoYBaC($0@6{dU=ewe#+vSD*FxFzY|lJsn$WM)=b$YHv|=qyC0
z-AT`GN;#%vEMv;X!P$#kiIBi#YcjAc>D`ueY~x@8uuu*~`k6*Aw2PlB<mAv{zF1N+
zM{JzJOJGI51ri-q-h>k@U9BkOGtOXoQ*o7Ji#&Rwy%OJwg({;Sr4<~i$r!B|IWN#z
zsM3yu)J^QKfN`K>%&famh1S?YmDH-9(OiueWZ&TB?P*I{azx);)S5sBbTVh=9jeTz
zkrHV!%M%Oj5`<76cN&f&4|g6CK~iB3Hy6?3z`wyKaizr1H0}W*G!Q`+Z=TL9X6cMR
zAH8lAnXe9M`s!L3mp7fNBqQFU`-@cErNT^2Q(i`9?q)1O)<+bZH}A=cOJU+VJifw`
zt3J~HPdpGIbsv7O#U&G`FF!Z=T%v9I$#m(Obn)7_{cUflgg{%8!L3RE)}&`E(y2~0
zUTeS7o<de7k8i<KmGV?gmrXlo0?B6N1gyH{+01m2f0Cs!cm@$}?p+A1O9j@=Y)uDt
zB)vP5jvc>v&#5k$tu5c<wS3=gL75Xmq~PrT#2Eb2IIF*5gjvNMU<|}}X6AyB1Z=bD
zNqU;4T@_<2%F-@yR9f2A)rvHjz?N(wi0eywN<fqb6D+_4d#ve6#sXwyAQFCGbYK>%
zd=R&2K>RiVHVHQ}{m+ABlKAp-&#osJUO|CgnZbCWfJDx(49HlE{rdRz@!6;5PNusK
zzEyoX5xsfj&yW4!Sn}gNfAVay_f-0^Q?w*|T3(XPS%19`kl772XOQm^Z=NaNwas$F
zWkH!^KvKkq|A0y)KIn-D^6U|8NT#A%jVh+N6bL*WD<whIiYREA4sFH)@)u(wM!jx3
zJmFkm1sFlz7Lw*=3J$L%n27|tB!W0%^%@am1&fbJf(JM8w9y%pqDi>m^s|gf7_yA6
z5il$odyWS-7us}#@p%M{axt6zB}3H9)FKmu8NDR|BOjsy1X22qD6+`Sh`HRENErds
zFd8PYSFy&Z29?+Qr(3_ujVeqkZA|$a6Gzkj_N1p>6+z!LPapUi7em!r$EN#UJHd0E
zN+QLUWMFI3yY>EQ)iUS|We$fMlTrMb>Q@D4B}wzvB=Fn?5Yqt;C`}j$I>ybK7R*s1
zg6xpxQ!%8jFRLI0a3VWlv35fZo=skEmpe0#Ar%|IN@oomDVr5F6UlyTV;0F$;Magt
zh);QE%)?K@0x?ywg<vRxZu0En8|hDGA+W1inYl}el?5;}gCHkG#A9V}VL(FcIqQ<<
z9LZa_At6r=-9k{q0{NHOy0uW*M6hxS4FXpDb#cerZr|s764uu*-YV(Jl-FD<zfz9f
zTgq3(AE9Irt6mS^@~-~2f2QYKwR5}X*Y3MrSu+)zuDddxuI!kv+&UASa4=&;DCG-H
zw<dj|v~N9}@WA1;CI)5B@m|Hmz*!hZ9vAZuJ$3_jq9o8};*}-;DT6Kpkx3O&nQSAA
z55!v?;ZmDM7wpfhVSf;Eb)Qhg(J`i9VI>HuXchK{L=}RGM7&qFTM)@f1c{R)$>e8d
zENsJGrisfejH1Cf(~x$C(zOM4YZw{96zxtx`n+%iV8g^TS`Xt&dmWuIOOzC9#e_q~
z*BCdWK_qR4Yu#J#14J5PwuXS{(|8g<<nWNoGm9CpCjz$|%^57`)n2JxDDO&@ccshM
zQu>@hBNC3S-~OE)-`Fu%cC$Xc{;{{}o}1o~{MgZjj~!2a?0B;0+4RSHll^DYA3OV%
z#`(JE;s+;A&wFYp<<6iHGzvDW;|WVL(3JExB^^!VT~t3Pc^4Iek=bsvf|1$8KSift
z)}SRF7HWl{%nfw@bt;(Mj-4@=t#8vcR`Z)ULro?Iv-^Kdx7d9)TzNGuT&`s`)#okT
zrlDNDSE6P#pllCP)&jUzsy(8oV|6@(0m8VoNf77}`56e-tjDZv)+6ODSqo*UfbT7v
z(%;VcB=OJqcfCwk*%OTMe2f140TnY;urHthR#-EYb2Ru>x~VouH84g@BmUsFu#TtJ
zWC}EUhINugTeo!^|A-auJ2c_B>X$GQ>7X{1-eZh)uHu_=$4+G5RJmf<uK1s*RVEZN
ztFEg2`~%(iUsTu#zuZ)i+{o52*_sNoyNhJsWu`2#oz6(#5lLVaiN}jXvPD8U1WEF!
z$Nn&~>i0q;BOND#JBEiiVkYTbRM3NwMilR}(BPk0Y}RJDgY(ef(2^V(96~5kRZXU$
z<z06LOVog{U^|^T45j6ZPC9cL%IX%`U5~*PTq>Yz4;hii2dRGEb(gZI{H2R_I&;AD
zcF{>^Nd8i_$nNr|aBXRg2MH#sOx8WdC5OZ6qT~`AmI8&=vZavETDI6&V(ldyrWj>*
z%7c{IDUVWSr#wuVo$@$kc1nTDKP#fsrOp!TgG-%eYx$DPX02HAm0BM{9yyowfu*3=
zx^t=ChQjAT&Wb9hwc_Wc7#L>sV8hmrp;HbsKQk_Ez&I`oZm!7*Zm#`M!ObBlxVesP
zNa#SgGHpocM3^#dNa#`nlhre!k%c(B5uQvT&K`s(Q;2f`!jmb)dF9aNR@Of+3vF&=
z8yNZ!vP>b)MF?3g#&0n~mMO&9kC0{BpfDhGvJmGIp^Jq$mkMiGh;x~+mW4P6g>@{%
zxm;M!LYymv4MHWJtHf^=eyfCyLN$J?;}rT_1E;%9*}^B+J*f%KiFM@$J&&A1GGH+r
zLM@yO4q~4$1fVMGp^+70oOfep{&!=XN0o4dd9)_Q-(&St?gTb6q|_~Jo5hGol4_n`
zJB2sL%5uL?i80<ztgj9=-d`SLym>1{6PL4C<InIEmCN7`uxDI)63=V3cfBA3HA5Qq
z4FR0ep|=tui#IID0GU@!(HICF$;eqV;y6VT6SK~N$OunYoga1V=*2DM%DA}vi=`X8
z=!+}R3dI_iy*hSj>}mx2rY(3oQr?cV7pbSaIG&Nk2_eUf&1MVK0nd*T^r0RbhHYpW
z3MMVU_^|<j^pOV5Rs{0L$pZj&Q`fwxH!!N#4i=(xeFfy!StPL=y~;bte@0I)P&Jbe
z-*fWFL2a<D71~s!Nv@S3_lN$w6^%ryw^D?%VosInIqnn93=auemy&9`R(QKx@Z{C>
ztWdK+H75y$SKaaq()VLF3iE~<e~x|BNM>($tVP#@Z;yiOviDxrF>(>PyeJ}BS-i~#
zPK$l#&Vccrk04QjoHf%jfDJOUMf_f5bhux>VWU5=`ru-*%`CkEQ}D8dGBx2Y7EIyG
zI^~NI<m>z?K2LlS@U2-cK1_cerQ&bs?%z^DF=XN~DvqOo48?>d(pJP9R1m<5kJEkC
z?f4-5xr=TP@swBFn25<fl|o9?I38@cA}1MG9)npVEjg>G8zTa)A@iNfYV0HG@IKzm
zBQYE1OV+*K|7O$ITE0362ddm4=c8%g$Dtf@H{;Jej&(RS#<{BQ+QBOa6KB&^Yv-$W
zef#kDN`9~GTTibX@!Z<+b?0?wa@~P+>%sZf!#6*kX<GHh@z;(gyLP9W_RKduKKDGF
z4cWhjYXesX;E&vwuGunQvtxEwMhSzS?Mv4`G+)1OZdazd{@U>?#}hBi>`qs2ez(j+
zp>~A`wW~p*kGN&QQJ!)@A5J-%J}|J8#0y5>NWlVq`v@AYj3uO{{<1-M3?PWcYM?^$
z5n-_K_qdhgg^(?z06Wd3SLaQ7?(IIB@wI4#1>i0C>QcTs?v0QbO8Ykaa|j-WCihUC
z9F~XRiN8Qy@g5cbABsFtgoW5`&6^Gux~5LoeWL45W2(gePHq1W6!1m4O6Lqf&d?c|
zVE8_TpWq(JWh=BDYyNP32+OcR(vcbxx6rmN)wXS+?V(iLL+Q5N9~=}1n#E!y85&Uv
zqF)k?V4Z%E_6E{3FS78tFT+5o?tIEtI><nkcW49PD6_X%3MWG=)->C}{B(>->VzYA
ze)*Uc1|^$hP;$WpMQKIkU^wTP4JIQG3x)$Lhx4$ZQo9GR!tP-oXADvaZL`6EWbKZ*
zRc;r8@Wlu}!*gOGjG4fCpwfgBbX8rudkJ4E^9*_l`C=r|n0VzHx`J)LWzm_jrK}lM
zmNSnkB;MCj5k<yELy=f}9{k*|@(2OZze2}AU`omtN}5w8%?l-~QYEXV5g)P@Y{gxI
z%}rrv;x?w47v^?g2b7IZCQpte$>ek{{zxWJvk+)Y1=^<D;RO}g7I(hwE<|SML|e++
zp7E70_{d_JsQi(y<4*gAw<-@M_RN}RUr29x<coXeD-XpFPWHtgz1^~Edh1s|6?Y~5
z4fBpha&W79R5Ci%yLQ_wH##gRmB?NT`m6}Iw6VuWf!aKARR>~o#8n+Ag@~yOjmyMU
zMbuUIqLAB`8PJ$T-GkyReN*0{n%P%)r=B>ggDHXn--<Y^Z*0|yvlUPl$mfwAFz1%Y
z=jyMZB-By9NPldURe%0|Nl4b~sgjImg)de_T<J?l(AR6nBln2cJ5A0t1y>8?s}PVu
zTZF>x_!uTClRBDrj2YQo3ryO$i=YF;Sz7+eJFr)WQSiR$lS2%UN<WDG#l3Ph-Fa2!
z1Nvl9cdSWQz}_p-2wA*lvTe3NAsuY<K?^0i&)VUl6M^a<Gq3Gj16p#XPn5)DQYo42
zi+yd*4-NGpDSeT2(i_IMgxF*adllOH&zv8AF49(@3enj@l_C*w;jy--iLeb2!77Mg
zKak#mVK7E)6{-=hpQ9>+R18t^1$2Pr8{_*F9D&)52p(Q_gSw_CY^(D4E~>JdikGMv
z8@5eHjur6{G$4jiz*NfIaw!uIdlT>FF#SmqnAk&SL~@tsPt1BHF<TzcSWO=J%)9>r
zQOu2K3qrWhfJ76T%tD9Lz9afVcU@)$p}T&~ZD~8U)^yeSOkMLE<*$`bKbWq2V7_kO
z?1fBa=-SpRTNB6Am0d`ZGP5yL*Y-x$YgN;Otj3A&MdmjD@y;7NlTRK`@99ZDcmg|n
za1lIRvvIy=_iQ<d<(fwFME65;(M(0{wYDp5i3911j`@o9GsT(8`gbb}NhbF}Ca*Wt
zG{vp)=O`9g$ynq@Vx>$q(wQ5bM~v9bgj_v3Ql5_Kq1h8Rg`}tBN1ns9o^Zs7t?e}F
zAsV=A6oyba{*fg37fqBLLv?ojpi~-i8Vv?S`Vu??r{xm7heUJ*S}OCPMSJrqfl4R7
zlu7TJ^cjcJzBPc8vZ{%3+P8A&n~h)ZxZW{qO|Md&=e1)*7A7X1P2uFDFgg$=bqf^e
zIoQS?wh>(s4K66MwLv0v<X)!7`jAUiFk-7mnmHVt)QwsoAU!NHockoO;|L66Y;4)`
z7#m=Qs?y4sGPWEoiJL1cV_C1X{G|+XK1$}@PtZ6YMH9=$8C#M1HesaQzBsmT4@!z>
zvSssZak_dtf$z~};2UP(dxXIEsPWEycW)+D;-gK6%z4P050e3dobF^8)sS+?$tFxl
zEqD*5ebAW@S)M>GNW3hk38lWZ!=z>--bE7cD|N_je_z8K(mAjtRCNjeEael(J5*T&
zJj>k83GLsa5(HZnm6*)Sv>s+a*@gSuVxl3`*#bH74-3rUg!(<Id6tTkRQwhS9g<BO
zzQ7?vLBd|SrC3WIHm+20njq#^(E2in;h4$cr3@gm;BQFz8xoIT(-Z%C<Z%ep(SDrG
z@x55Nxpwx-*)I(OiVB)1T@&VsqnS|Cgk#G8*@Ab?xVC6UMXbf}-5S0$0xCL~a#ZTt
zG=MSeAW@X2m|^>FT>X%dmbz|cGGI_1WXW-ee2R6%T>y(&#(sDp+w{Op6>W7zEyaTb
z3YbGu!0;v50Lj7PHXTsCur1%X6IYy2z04JCrT#Q`S|Vp7Hy;9RiGE>cW^C_31Of*r
zyaJS$kWJw;)ezi3(WLlG+p_pe2d(^f$Glw^)+76(tXoBRKqi2|fJn^sOw|&LG1`zM
z{ty?Ln^Cq(_5jj6sDx!{qA-=HF_~UP)LLv=qz+BWI|;o^&4;M?0Tr)M@k1(pl?t|w
zJ4$D4&6TZ8(y$P1<j0GAjgp#-mE=J?_tpOv!S*cfzpoo-nd`Jvnk-*6?_R~6kT#_J
z8)lxKLrfRtc?RIF-t-|uGBa*J56GO_n`oz<#@wB(MKw+=`7xvxdMfF8>h66bF5N8R
zlBW1Zm3?=W<wm0gWsX}WK?1{$L7ag2lE-~328?1OF@yPsi~}stgu@y+M@zg*Tbr#J
zm?+_zOr+u3#sX?2*EU<MQSwDn0YY(bQyj!Pd0<F6`XY8x@ke-x*o8A>h%Mqli0bnZ
zxW+HD^D5vYM>H|8Ab82KC5oRyqsz5@4h0$;qY93HLZGo9?ZB4=KJXN5!RCp={kV%7
zWx3(5@rbBkZti=(`3S<&{n(@KLCGs^eKLTMv<*qe1}@E^7s{c~E@B2Bg*9qaa^q?8
z9Qx2}Px1_d{T-CppBb^XiaMy9Sw<5$r7GrNuZqH^d=VndRmn((3@D8}lafi-p<Gey
zAR8S5<2CAS3^``fyjh{1g5|1m&hp~&$PQbqL<v~bKu>3Em#)(IMBnLwVG6Ycg@EFC
zelW@bZ;wI(Wpxs}YN*C5Q`RoB+7aw;HWI}Kk5Z@zcc*h{lr`0`xeG(3YG*vT8S_=A
zbrac5{i{^zWxxcsP*ropGNzxk_7B3XW?8iCOQ^kUO=KDV+#-;E4Xp#DwMkhrp2wHW
zCci6g2O;y9AT2|E^FsalRQ>ve`mL$@t;o0Xp26&_PkCzMho(y8#4AndKx=&8?dG=W
zrmweMZ<{$ZSDaq8H{HB1zAssf$_*Kh|JCkG-BTNX<f&V<qXBqnIDIVdOIgkB>QJKW
zOHaRRHB(j<GqS3%2*CYuY>!*HT=gLkWu$BoCk$Ee$@z!ILs#E*QzusB1D^p|li9rt
z(%L{xARnn5d513BS5mE#M61Wb1^bvu-FponjYJI0wbL03?$HK;s$k9IKeH|sTGf?A
zk^FID>vf@C0rp6*`ltfv4E#7C+eBuXWflgen%uyraw7x-T1iQ%$E&zpO5iIm7lb$m
z{uS!Ssyq&SA6ov`1gIlu2Y^Z;rOhcHwh0SN9JzdK^4Qd=#9+E)eY$7^g_Q2ScHqhZ
zM8WM&S8YxQw@^rFiyBgjgqNDsL;dMuLCHBX<xFf$mbKk-tRk;aE!b&gK81sBz$a)p
zXl)dK^FuYNYn;mUc&0)}A(`nt&E3q`l7A*y&7i^{HyGpBE4isFw3Bgcp3Q*j5@*Rf
zAQwvSWOaGeT)S>Rc(ALQ3xS8ck|dz;3AJ&#w_2H)G8+hPNfPiVPVTbErzZz65nv2G
z<eu&<UbGE=X01=`I<n^g_j+d<&ws?bx$Ar7Udi02xbJA(->uyKRW3uB{BlKJK>VH7
z{-9njm)+x+KT-~lWl9jfT$_?<H<Lb?Jo*FbCrPV_YQ=_3um=*E;DRZ~icjPFVr}_Y
zA&DgN%T<BozY$W9k0cjJNb<;cpkJHvubpX1v-rH9x(nma|HclUh@hl;s&DcHw#W5W
zPMx3kHfG8y7s}S9%GS+nN|$X*`nJ)H=jXjG?8e4a*~Xbu*zY9i+d;C==6QGh>yha#
zUmc${&bMrxJu~;o?>=|4XMX2XOd?`$ZJk~FjrQ4S+P^pH*((V@+mmt-(Q<n3z=tq;
zE?^W^qUUO~*|^C>Iyr_Q|3DHASf*b${!1fEBuNOHcj%#mMuhq(t~-jj!R!lq=wQ{Q
z>&sUikPwoP9AcD?DyQz04O=|9AQi};q*}>kQBFo{!G2YF3v*_%@VG!ks`KywcdRal
zhsY4dJ-W$@Khhan_d(3!;P7ee1p&jk!Yfut@4c)dHmgQL{=U=USc7se6zz*V7y9J+
z@Ofl9iJWIC`>~JJAc6&dicikk={|4=!u@B7IGm*7b5xLg^bS)7$<Ej2K-f3T`Xctd
zR*{o(EAzcE+1H5?dhiCStL%%5V2b%%Mq`Gz4#HcOpP9~>UtZP+nU8JNiw&MeDWnE2
zZ1RXKL-1GdzF2EMg6G-D6~aU45cwv02mDrIw1LbI!II){nb^RSk|1@@bSsLu<4$EQ
znY$M%H>D~!Wjqf-gsXBP-vwkiB(OU;d2k`nl?rqv*Bna+j+0LdvT6pg^9YjdT^^qt
zhnc*rYrgDQa{aMPWkX``m7Tda9{l$DZ=e6x#cyqY*KVnRgl2(+<}$Rb!5gOFbJ75=
znG7^0y^Tpn<8t&S9?H=BS&YGD=!wW^0R&a~jVgBK1M;{9I*nDeP9ru)5wK)IEJ6l5
zL^43PFkQvQskCPmvH_80L=P#YT$?hgpf3mll<MoCAMss6PNhDOmDLZTeFYU!K{`;M
zA+uaxTC%gS*c|yiI@%JRv*o-8M#~8CZ@s`<E$PYmb_5)*+Q&gZB*STl0U3F=68vg0
zoaLT`y_sPWtu$%Ye~7<g+vmQEy|hHe7q-Yq-6n<G($K0=La_PB7$@5lHOK~CUA`;r
zx2?Tdq1+@K8$e(hVkB8SS|nSq+*74oVxQVNO_Y&tWbi^*qq?hg<nH8PGi4uQ+17jU
zfqdm_0^i20@XIjw3xv6A@-bKbAbFG-anN+Dh%opa3=%N7tQ;vGiUZjCxhU}Yqn~@~
zb5%&J-q;*3{Hd~+?VVaAx~$JswPxzqAcuOOa1lGz7h<8zQ#w_Wa@Vl^HMXZJx6dA(
z+m_nVovwU5{wT0pzKyJ4rJGWvn`X|>_M|o+NS7Xr@2A_oiH(<bFb{<dsgeydM`t&D
z<3ze-*L=yLxsS&mrW#dK=TmMhO4Th??@d+jojaO5bRxCy>2&oo@$PqFbgE&u_NS`%
z-}I!bkH)+4P*r`VtR@p|%+#z#XDMa0)hVTn)^cUyzYOt-l4*U3bwljhwP-G*4~$e#
zV`8ecJJ_Ekc_Hrr`Y=IRTGv*%-(ip&wmZB+HuTII*fAba9|OpAbR4ynUE?jW`h5~I
z$pE84AC?XR%!x^=5%ec!dSM)3)`nB@0RpF&=nR%tNUp>lB3bVvhad0W8>Us*eWExb
z!WV`XV6%mC^UQ8A%H5qLed#KJ-!j(}8T^z7Rit@<AdhzIgfFzaWMUZMac&Badp5mx
z?@i<U+Jo3^v!LR3S^Yv;YpSeux@Oi0$EW!=q@Yii?MeFfV1j+cap(JYt%g7?-ync&
z^%a@2^3OW4yi-tdFG3V7QMuFb`z5<d%{NMnD08wVD^q_86+dw5>+Uo4etBwND%5O+
zEKRozCWj59<~B>LPM$7_%-nCb81cJq$)7G_|H`z;<WFZ>zD(1yOpTSNWjUGKOS7`+
zKC^OjIQh)8sqWrn_j9-Xr4ye@^kH&%+OdqcXgOE?KQO}L2aj-*Ji;>F3mx2hzftZM
z-@ri01L^>EXS*BaK={9=p<Jf>$V0h|DLg_W*`<u+nb)ni+|6&UpML&paGRZP-!a#E
zbM5!rX$+sI>^f<GLlWjEc|B4~pNJ+f`V>G9J`hNc-3Le?k%3g)_hBiO47%ecRS<${
z(}g~<Ll$qua$3h!f;}N}Ky*?B4|QD;%S2x0p@+S=ok;C@nEkH?ayA%L(Miv>9W>Bl
zG#qD7DHPBgYn3NlWx$y7$o=LVi$OXxQ2Z(enPn#A9^<bQTyTRCci-cXk+q%c6C>D_
z{wziz&vZnYFk@?1;>2nPRqoGZ{U-=u;%JT&#IvtA-Ez0Sd3dJcYrS*E`Ho$4XOa5o
z`$LN+YeC8F^2UYoRjKk-)7xhHuJ1^fZ=JB+_9GMZ>%uL6duH91w<@<zH(uS7uzdL-
zVv7-HzG$YMgJG`($&8C}=P%x~8>+Uwf7@T9lFkx1nFERA&PA)SpyXbp0iF5H)w|Xh
zZWI;oYPZ~IFwuFtmC7~#-FEZ$ZAO$i6jhO;{{at^^+|8lMpb3O2$36gg<7ioXi{Zw
z03Xp5c4&Z4--4vH@H`}W(S}8EmT&VkHqeF4s>7hgT6KY31HQU-Wz>*=sZ|1KQ1}f{
zHA&Xf25c$dC^N&*h!{cuL`d2dp%cDJiv6B#@*$EtB#VK-@;ftRGJqx8FMfh<F)RI5
z`t!>uBrp|Uqg&*>nzav(^wTmy9)KnYKsV$A=!X$cPY{frN7E1&y_E~z+7$Ll46Vg3
zvGd*|GlL789!_m~cy27c=}6pi8(dwuy5|-ap(<(?DmJAmHqAuS72A{E?eU8!GC`yj
zyW*M{OZpn_tlPA(ZqNL>J)gIH{>W70LPdM3qCH)*I_>L7dOMSjLpO_2Eaxr?w7rZz
zeHfDrd}Lhmj=@NlWcjk0+x!3xT9S*_=+IkBSKTaOyur$}z??8(2IppPN33Lj7?~$k
zy#{+(AKcq1Dn`J2&b_h`kY$>?xAub!7;=386<6dnwr;a{o~HW-ddo}%G7vCD;WFKt
zLXigmpTQ-he94VR(YGxMG~*}Hx}@T>gcn%sT@4lA?N7QZ`KH3hr!P#OnK_$m*p&?K
zPO_9*dCLBS8fCu)k!~MGB_~A3`;AMS^I?+E@%%$;ar+3<s6+y?l?@&9v+59`U2cRo
z?{ePPrjiOho~7opVqWn&sxpiLIjbnc$lyX(sJ`sEGiDOux6Z)~$~^}+TP(O&PJ5up
zIvnC+n?DGy_J<M3HPF9%WMnYhr&`DOLLNLxnQe<LsW9k;PJNL8>IP<jo1;{kL^CDs
zqGC4{e}_WOyTKswcj!TaMAmqInwEcw8_TUud2V1}yga4wIReSg;SB)E;?jlU=2UTW
z;zGK(6ALA|2Bv)q%sCAH2C3#KOK(Ng>Gai$x7;naODir9O%5gYr%PAI_sa`_2NM^Q
zm0dsbths}Y9$J#6tK$3bG<V2g`*vB)ggLoNN(h(OqnvUQg$^o*BE9_$F6BsXCY=N>
zdQub-Id<qtQNy&HPWE6O2!`v7vJObr-xW!p4kOgH@hS^46y^!1BboHsH2I_`8HXcQ
zew3{`s8mp9dKy9~ev{zAM8&sc$dDKC7^CaQS7V3Nf&Qo%qY5|hHz#s-?h(vD>j!j|
z#4vG`DycM&Muab3NIL4PxW63CR$3o<iNNd<+JHQ^b<f=1KW)6V_3;_YTfvRfmaBm&
z;mZ~2;Kt<9r{V={NnuUOzh<U%wi-zT|M5xVFW&PT$~Q5z`9kroPD@U54yFt0C+B#A
zM&#QxHY}k7892Zo*i|M)u&WPJrH4>JB35rPYa6Sy2Dd03^2i`>WfxU-adRB2z-)5t
zjLdN&y@h*<($Y`Po7F~@H={p!S7)hxo8~IbYb-z+mQUp70eOZu&OYGJ=-X_XR2d8|
zW|SWM4xR0$rY&MUe)98iXtQjv)iBn1wUHmv^Mok;ovgV%yt%wv(kTBXy+nOLx=I-$
zHCJiW(4pVTy-G8Nt8eCBr4HdL6Ytm<voVyePEcJo2ka_!52K-8RX;?%U;6>+I+%AS
zTS|Y1T4y3BdHM2H2_|<ihQN@s4sT>GOX5pZ<yWYn<wB8`6vQu3K{g_hED|E=(jw_e
zBFUm6$s-~$0g+Ht+)Kqi6twywr|sBJ7pd3^K`latE0(rn>(4A^>lT>#dD@OOO4^P!
zJZ(o~>;2Mp1ncwCb}Vht<lb;uH!TKhS@sTO`moa(vUij$I_b=1@FV93op}u9^@{~`
zR!G@Dyf|ChZ8RanhQnqJEcu+cQ(CGf?qH`paR)o)i96USPu#&ydEyRs$`g0c>Czgz
zb>mX8*IKny??4e?**d(|rltB;WD7ZBv|EdpiY+KS7QEWy#967``lxZK*o8_+?(x9S
z>)qBS#-`Y45{*?3iPIRDCU9w4Hje@|n}<+HxjcHTNXEqfvtG3bUcvUVt;Z(#kio;!
zV;72~3?9W&1`odwKn@RUk4x|iCCJ!e?QyF)JaW&3QuZznGIMz1lqsVCYE@Y_@bG{b
z?uWT+P!mWU+nAd#1IZaeO1;of-?<Q_g2K-2edof;vim=E)(mSeIugm+um*?4$Q4s%
zR4X0Ve4vsr<Fmw(LYNx3e%^KzT(V<nY$}-8aLdt}Y43<zUU6mCu8&(j<6bU>;7Kk?
zlU|rBg~;lwzU<87qvS*&CT<z|9<WbxUd-A?!~uAt!FD`=;G!H4#;jiqp9a-NMgV+0
zt$)B%E!L|0jXE_i)8_`zUwmzKU83nrNR$7n>ym3?6E-4dpV)off-PzL#ODO$B*<FM
zM280X+Rz+2sF)>4HYHgA%^8<IffFc-P~4)Z!;diwx5ullp&E08mEVJtpj2NlUL|>p
zTFpD;vBDOm;`jLweFr~$%>F%H;M*K#&F95I@ek?Nf1u($v?EfN^A~lp1<J4x+{Ehd
zKXg>*i!^9!&>)24U<e5Uu-VYmu`fP5U7QZC#x`M7O<!zJtV@?PV@0IOg#o2amiNp%
zg3Dn>QLYQoHKttWeJ}l~=W45(cRq@L1Ef{sX(cTk#YMbS3M-{keyQrTM6xU#muSU>
zwpW2iLIq@CXiV^X+m7mEh~`tGgdu;AW7F_4q>O{@(IG_#OKSTVtdOucy5x7L?&qgW
zur!*<()db;Y-g0LloTxtr}L1mdi7Y}Iay6-mYX9YQ+@u3=9#7#mYf@S8`qx*kGNqc
zO4r({XhtE05ocY|K9M|r04{`ILjzHs?28)8y4i(Zwtq#|!mux2;>{LI+ba|LNvr>{
z7F{4(UhyjgNn~6?5QWzDGTHe=y7*(zwUCj*HR-xsI9Z51hL22dPy4p8Se&H0iW@0w
z2x-qwxHEp*vBckiAi2cq!~@Byu8DnEy{V~>+b5h9c(&<*w<@<!3sXlEd%yVDeC2jr
zC)$?rmc|R;zw0!V)Le}v{i|qsr{ry4fEIU3{`-4a;M)-?LkGWCva7>zqr$!0gfL?7
zt_RIGb{bJC1OQbGv}Vo-00k`llE6&)4i#mL8s!H8F7D_kV5$iLM8prL7zLPBD`UPd
z!3r&DTsk>Hf+;}%oyd+T+eM|C2$9$AogJaQlGRJ9i5-5fDlVTCJ`1+%>W($&g8E^`
zQXi9d1b1*2dk|?|BGJC+`N$rM;`}_uDC?FMnvRT~3&)(aQr|_i8rQ|JFc6I#B};k)
zH9;T=Q?gFJyZF&39~J+ca3o1Zii&v@sC5ICIS!GjA>SoN%F)4)j)-e6S1N+H+^Ift
znwFK)ShGG(<ky=al=xLN2$aa(nEXiEe-vt;gKs@vR*|U=VW<0Rk6w9nx*}b*VZLhb
z_srkh_j~()&y%TXzBYJeaC-Z!KV7q9zGm;7KU3RsZS2a}^kcIRq-*!j*M9uw1L~!<
z>DnFhwY%qv-Yu|G(54eXn*q(9<>-=f5O^^l|9gzmFA3y`6C*P@qocZ9P7jpEawFRG
zw?4LLqTWEa_1aO5s{lyk14N=&+L+n?Wiu=e`cEj)>CzKU_Jj*h*!82v5tj~E9No9O
z$LumftWZO<AtEBp757-6ihh8TYGp*Al&+(XeoqS3v6AHuyu$&$Cr7i(ybc_!4e6Wi
zhoUk=l6cWi03}TNh!r-3_V9>pwo%GGql*b7G2iwxYj<kz#H`!9a0&4PeHRaql*L$?
zMI*y30OHtHCe7qvC`mpXLm95#!k;iD`l%N`z<Jir)2T%mZ_7GKib2RZF8)OBDC<?$
zC!?#($|3~sA^G5GS4t#C#)*+!Gqy?}!B3ta7!-PQ>;66=`OnbuGQM{>U3>(5uewg=
zTS&ijXz~!-7n&jn1K6<{JnPjLF1;|d2||{)Ic~u|BbRqf?nqR?WIpeIe5P}*V$O4O
zcXG|+AQ#>s3!eUX+S@qqeH2E-*=@6{=fcU>NAV!f279Nfkuo<)yUUi(>`hm0&6L-(
zT^=vuo#pEx$Prz@Zs_pCsR}Jru1!_0omrKxL@NAX#t~d_)FO#_!udwQYX#G1u{CUH
z$1TUsOl5oA67L}{TTz4Wv0d^qcDq~*v|uP0Q6b5M5fw~Y{y`j2MxDb_)<C29XEfDX
zV*Eo~$R)-eNi$#z8?idwY0_3n)9jSs^_U&6f5F?F@-`<T)BCUlm2|B8NA3Mz<o7<a
ztoL3CbfDVs4`|f=fV^67<$VJZskBWuOkYfUHzysN`8VKI>>znVQC|KnuKpuOj2;@Z
zOECZstJ^n?J2XxN4qZ~Ikw;_#HSPq7)02W!v#|>VUEkl)Ii}>zBV#g*%iO2`pQ3*X
z3mJE_{^|KwI>+2Hd{h5aMd6ZXS)8g<jZ-D*$=-EgT^C@Or^RPN3FUVb2^pAt6mwAx
z4kRK0*|K0&ZrStEQ-o6@fu?4s&jL<OU#9yZDt<tPUhpZid=k~=Z)Y!i8<ivEsv%QS
z`h8Ioh+3%&)ZFX;ZGz=Hc=-Jf2uHo+E}1HaSAJq_=E8gn!u88OyKQP+eDCe@s;MK_
zj$JvH2xIe+>NQAnO*w~xmk&%Hn0hK5Xo~NXwu<UX1-oWkv-{G@3L~1Vns+x%ubyq5
zU-i%jG>K)NGm~egM$@HjSmxooPpwM@*UfChPCr5HKT11>{?r>-VZTs@mf&l1_*On0
zH|UIDMPnAXiGM(Y%M7u^BSkXLYVLcOe9P}M1HiZGKC=R_GiC~yp=<Q?Js&fABb~LJ
zzFO0ijd4%j6oJw`7xsmfGGp^<-$Xkw7&C}dO~dS}_F)DDKcUVt(=grV=`*-6uD(J1
z%bZG*u+H!6HNs5tg)1AGZ%}i8Oa%jK5)3$G|CrAHGZl5z8C`quzoXk!yh;%GdDLU}
z;0MVbykW^@w9+=1yNvsc$>Yx~8VvhP2Tk}1n+8ljGuU7&MSA11r7D(g*>5eoyUJ)?
zf7fP&DcKfOO||Tln`+r9H`TIJZmMOc+*Hd>$yEFEB07E7KqZ43*3GsOB+KnRbv}At
z3?nKNot73%8LpE1rAV94Yn?zMoqZ?!MdH6K2`$e*Yd_Z)Ju^6PQY1>7wIM$cy!rWx
z!Z6h&nTSK>_vkE11+$&A0i(zR-Y4Rr_Z-`YMuhW&;ho~&VkGg;5IKVa3bxVsV?+I4
z8QgzisQ3$m`^Scc|7@uLu_5?lLn;3K+;-M%EPWToA7kmyd+cS#_3s)`+}&`}Vr))U
ncHA}4$=yeshpon@WJ$|i1D)I*be%LBdyS~@GXpzgJ^B9u;I~~j

delta 16212
zcmbt*3w%?@neRDzzii2tELoD@mLIZ>jSa@eV8CDqPZPjA12M)&fQ?@{k|B1EqNK}B
zorWYLv$xnyQcTJw;)cC-)=A@T+6LORB}pH8kXWefz4UI|-L$){6SA8&zy9vt@0+6+
zkEFS~O8Cy4nQy-Dn{VdKeDk02ixbitKaga;n~|Ym;CJP<pB&9N`AX(i)^`eC&oC}#
zAImZOBpka>%IP@CN!dP`OU`9*(vz~6u?GD1DY#5d1|>>P&lx!RN%=k%m&GX{N6lq(
zN_cA23};j`iT^kgrv@(VZMiv|26A<j%NS?o%$ybkWQ?kumYF8WAq9E!+iHnQPR^?i
zsyL~@9%uMmvhA@#viy0yX$Ql}XjZ<!axyCz_o!Id|GYjI3gxu05DMj3=#>dFv38Y=
zQ((@^ED-nsuafeX0<RKF+L;4(s38}~FISr@<$~m*<YfuvWxNVO@d$g$Dkyp+EL4>-
zoQhVqBD1B5Q=tG+L3%w<qNaRndKoXM<J56QO-V(IZdIi6s6~|wBd9#I%kVv6h?_lC
zAt*^!i;1i%(CAp^)KVEED0eUdOHTW9ESf~~ylO$sX^&Mh3_mND>2<wHF<y<Bm!EMY
zm8V4;Jy}Wh8WJopksJ9cvh}#C@<G<EWtp^MZBms^(1Gu&ph+2m2Fx(&g^V;^nbe{7
zOd%uXP(dkVEC)@eYQTJI`r^!_JiVajE7Sa-ztazVuAp(7so*j_r%xBm=~1wNK2dW9
z>VX<jMP^o-RR&twX-MxbZ<dhth~x-#u#k0xr2?|4fLc+&He=GpY$2O7(K2>42h!$v
z+5+j^c-jhSTRd$SB+oKj-t!VFHJ|3fD8)|m6(pq^1>>VyPfoH6lKOTqqlM6%qPVnT
zNSDOZrI2>S(@Zbe?kwy0ROaAahcB=(*<km8E2eZk*gY`Z4++k7xO=4E6O*|HM+SHt
z-7$Gn_u%N(!!h~LpbH<}{r&Kec}9m_F~!iKK39(?rWxjkhF!d;*X53>c-I3Xy}XMf
z#b&!1_<6p2G$!x$xCY!Yh1<jT4jv(2vOZ;rDSHP!t|Kl!rX1)U>>U^x_yE5>^1JNf
zO-?Pp5S6QrxCUK(x5pKe^$ZP<##EfkHH<0V3B|k&c@!hV9B}Xke3A9{y21Qou2FYP
z3i6#M@=xk~ofg~Eb-cTO#N{TZ^+sPz!MohpQq^I;`^bQ6&=XT*le*9$d@BlHfn*1g
zRX}1|Y-5+Z=csF-JErO8xL!~1&|r6eOp8rR6v*%;rae5w4|IFFj)DdJ2B_^e0VzuT
z49O&qy~%fwrJ91Q--E*+VWQfs@fA^{1)ii&Q^Q8dW4a9oqPC(b^JMM#rfYiJb&LIs
z_q2EFzUi!U_eU&?gNDUXZMOe#NSlXjmdU!07->eCUlGkKI=f|ZOQ3w(GqEL-x7@Fe
z8uLQN%BbBDHaX^%z%;L7bVhPMv&vUiF}^OXdJR;!7oKgMYz>&Fxrx?@eVJc%-Izad
z^rG@T<HD%Pc4o`zEmM{6nW|Ax4G1#X#<$#n{EeqKP8^Sz%E#4Ft!Y9P))qyrg=cM(
zwyDk2B@t`m_{OLu|IFCwv8k%Sp@^k^e0{X6!Z*I|y3sPBIjf)4M{=DJV^!F={318q
z{PN&<d(>k8h>>KhVg1r*LFL)O$-%%55LM9V*G3CU&JIit1UAj~ObkQ{R{Irx_cPjg
zIdab{7+Vo44mw&Q)@9=xuj#GN^#yFN?!H>kdbuxJ<ajCLTt=X8c4R8U7b#i`bw^HT
zM2*(*EoiwitStnOoUNLyn%WJP+UmzQLC2hFJ>5EGpI+>5jToE3Hf#Pwp1&ces}HmX
zmcS#~=y=sV5gYVdRBxL&7S=nXmIh274(lCJOKB?E){1FYSYH~o)I`lT|E`H8{*^&p
z35rvPwZ&0$-kHABeN)zmxqAGbsNNjZmt42lCYp#4G?Ye-CbGa}(F3z0tS!Ltqt6;w
zle&v`@_YL~vx75pc^g;_FA?N}EGO}*Nc~PTEE0cYd&ts4d+A0Ph9CR~{G6JYynpC~
zi|1W9GLIm^NuOUmbD~hevTpKlkz0AKa^d9q=^paOqIcNC<N;F^`9ty9g<d7ccvYMn
zruz(-?qQ7)l*buZlvFUG)3wd3Vwph}CUq5`C8$WK(?tGdQlkQs7+7=|5+o**py8Ak
zRf#3ds}<yemSmP%tA<W64@&nkCs?PtBc_HAcz9^g4O5P^Vd26Lu7Hg(WzP`IDT5wT
z?^wp}Bm<6eM<?1|j-&&KQ^y-IeH;kRM%|tfH}4~_JL(qlU&1{3fQ#$x=Jz7gPRvja
zcaQcDb#rbVyd^(dNDxC=z4{5rbl(6%HkI+!QG;n*9<}a<&rfY0-w@U3PTYeXnp-%f
z4&_$)<<|^3@Uf`PAF9Ydl-08qqAxdRy{295V7~8AuU;tqejN*x_&M{;=JIc_HZ(ak
z)$v>L^<E^aiMnzvyNYbB+`^updA{-!cHafI!>LSXxwS4%kNi_WoC?tee$03p$vz~j
zkURs#tpFl6RGgfiBJ)+{?CZo*{bTDH<oYTQCrg<@7<%c`T++25m*{I0t0$0yvZ;_w
z#us5mGWSz8&d~S4I&c8$K9DR+<07348cY8>lmG+v6V=B*2B}XqP_IZR>VUO~KSM4q
z$ZMg3X)7j?HKka=(*~lgVk>DXWq&4-)NU-G4yI$=i;Nia@&pNb>H_&%t&M$wyjEM;
z+|J6gZ*G=I<sIxzjai;Mzl13$nO9omjvGeDyd0h|*<{&i4orm_>rFN0HP5WBdy-WI
zP~-*j-ogg<3Q^TB&uxK>GmOCSa)II4`0~thEcx($Gnuz($iwwY)r-Ices+;3>o->Y
z1YX?5KptU!sW<vP6YggoiW<#PeYU^z%)Zn6rlh1Rq;~{W4kBszL(2u=<graL`N%M=
z&9rGwmDu&v?L}B9>vInc@}rdRaBsiM%^xS#i<%{2hPW0D_^92~#Z;aa`0nUY+P4>U
zckRnppaM@j233fuzrz%c4Y9MHgA~~HJZ5|y$yp>*NX!R-#&r0V_Vx_8JV%E(9`_tP
zx`BTIi3JH=LeFCg$q(V5y9>xk=9+BdO_@Y)g$_|<e*~RZc2f$ec}&e~$n@g1?0NE3
zomKK9hGaDwVZvk%!{m5UNB20{#K4!aMzXgtzX|s%3fR@)4h45L;-*BySvVcMYq?x5
z1D-n0%4Ona1)h3%W|CJLO?kMT;cQg20YvM^nFrZ@1_;FLF%x-ovx&4V`3bv`WHud1
zjFX3&R!M%vknc7<Yoy<SgvVJ7g05Z&PF^6#np-6Q!jPAmi&$>vN^_A!fwT9gRiwKu
zhe(&173cz<BZbQr`!E^P^zbeSk+`mIh}Fb!3Df-B$oCGCcadPvI5qrtF-`lMehF{k
z>oz2BBBArh8<<MYMlkKrNp&&iQr$m-R7}&$xyXCV_Dkj&vS|4q*q_dnwi1@wI#v$0
z+I&NttABfZ8mD%^7mwqd|0&j2;ee#^7&Y-{SnzWoVB+^M{rM(-2U+eg@qNri>HJlO
z$zb>(CPPTV<j~4BtZwGTmA_`!ph6hv)Rx<nE7J5*9n>L7CpqP!FRqfGwVBy4`E}b4
z)<Kr8{&OYmNf}RFN9&}FlZtiFYkY_tShI$0Am`R>hpFfCcpYr9v>6Qyvmc^Euf!`A
zq~w*>9P-FQjh0Rvu)M<VfqeaM3dz6`b;n^zVh=jXT#$6|*ePHXRl6D$+^YM6EUoX7
z-f+u+6W0K8W9`QKmOxzY-U2xgoEDe8RCum%u6RkPcuAzV8KN?Eb4ZszzHvex)tjCk
zeSCDn9MKm|wMX=oQA_dp#V@s<Yn{%Clr{w|O<_Y51ZL`Hm?{k>`t8!C&bw}y&7;!-
zbvW%~rD$;#TKo&5UY}oqE{5?zM;i4M^dJ*c9~&Gx(eL75A8`$N50WkGJK5zkFRag!
z`mSJ3azIg6h~tyPg4;%aa(vP6;DY9^6+gd@GHq<Y7gKt>vw3X8g?MlO6WZ_u*|~Wy
zyKd&2n|q~e{&SY{zePd6Ljse+efRETcad-1`|p6QFpQL8*qfbdQv8II+}Ji)*91%^
zj{-{Q@9`Xgc`^%j!>k|?q=HP4UzEKp7t3HH%3?T%JN#C!+5-Wd_!Csg{ip`^mU6my
z-2*|Jf~HmrDo$brR!&LZTLiN5#T>#PLP;9K)7l=`LH9@wKtDog2N7R^sa{Be1*ava
za%7BG=hXs&qB|^ZheZ`DL51XtiuC;jk!mVvf70sRNvk!qWUC+rL<7Ja06j7UrVp2x
z+kPHgd+1Nd=)(r5|H!JPGE#6tYfkv;R&G+i)VLyp%S;5h39gI!L=JU;mO21EyPskF
zEPpd$r58XG@T#QGO1ibi)?2WVM>K%JWpUX;CLjvN=cT>uEp7y4B;Hd-a52+oM+sZ?
z2@B%9qJRDoctsTBe}QHN$JiKH0nJCmZn&E6qdVKT)^cb2yavJGR={eR#aZKa8Ni0T
zbk~XL<17z@v#$`XvlyTyw&x`m?FlPc2%Y+hu}p7B<N-RP?<+;mI`dMn6>#dgJnWu!
z=IQMC*n?LuAT;1T;I7Y4NDvIi-~)mAG*`%mfoPY(I0ZhazZ~i(<n)zMy;+G`)Rqde
z?I~L(uoNKcUv%tKNyk2(=GelxV|}0RSnJ&#s~4M7nAZ5uYI5}#Z8FpMSq*EreZ+{^
zQx!C<n0`TJ*f2T|h)7g^e8f7@d##yV5?ExJQN*ak5yuOvBMj$wK@5qHab;ekAm_Jv
zs>M+Oy&(70knUciR4z7mC@0YmUQ-&E$y1xCk@%wcqO>{8l&Hm(<G00Ur;T3|SAljX
zIK+8CFoGrV@p!<P8i{G&X##)yDzu#8BsM0kC8yGKC+E-jcla>y(-{-K4)_*GR=bg<
zUdlA2dntV$)v93w;RPV{i}(4?FWBd&mLq!2RdP=81O5Eff`qo4d>C-Rm!drZ^tM!X
zGVhj@v#Nu4fR8_b1&VP>W76*7-k9WgJ&%jx1-ZDFD1tQq3X)MI7$C%?_pI&wK!&f|
zkvxidKH0rncXY-SVvsAY@^o<(!(d>!AW2*M{}wC$PbB|{<X1pGz!fnj!*~-+;W!Kq
zncf#6>=`p+W>+s))ax!vAe&>dTF-+X*qPC2^6z{oCK<UPvN$kw9Kg}`wVT&=uKfVl
z)0hGxU6;q@lu(m9ol^cItaTF!Hf&5cGK?sLi$l@;M$CtJ58wx}BG>86756?aEUHBE
z_efwX<YV}0Ob#N!I4`CUkxu?!F(-nA?%`<U_Xm9a4w5+}zd-V9B)>s|0ZL3dJT#m_
z9b$41*yeJY#n9^kWGh0F=o*{Y1fIvt!$4vxw~Jz`ZgP27{uUZv$7F|wxKaKI<oOX2
z+C%8)c-)35^k+;%Jq{oaKgwT*47V8w#-j8`rhjZD;T?A6QRp4FLQeKSnM-t?PG?kW
z^sn}B8($u_H-@#1*NwTSn@+Dl?DCT7%HiPtZvTpi@la5Ah%DS~^4-u{CV;JI>cDh&
zxU6Y*{iSW+-gIS2c=@*Ix{W^`x;!+uZhvUq{>Zxf-#2#6?)10Mnd(EP`suRwOwB=K
z*LXV+*nLmP{7ZwnyxXMxWf3`dl|j6_bA4vpGkp_>0N^v_&Y7Gclk<8`?u6y6ebPR)
zD{x=Lx-^p0ay_qbO8JuZoHnp!wjolqB9gaqUe4rH-DIRWnd55_inUD0{VhRV{ta#J
zL|a6gAGMcGwM{M?-yF@&Lx^=Qw>p$t9oQVnT}pwfpuQ*yVB#KMz&5>kdc`GMuwrvC
zZ%fd!C1}`kLvNoL0l+elKU*AjE<?ulxxAK8Ud!y#NZ#6@Wo^)~7MYHR^<{wtv-RPs
z<(G1=6kjR1lo#B-C%CUGxb0xL?O@ba@U^O`62J1gEq~(3*<+K(0?z5}k%H!kZK+>*
z%~BAx`wFIVgVn2oMQuTQThP=NHQJ^eFIAtb4jC6vmpDQu$FyZyJ!=Zqt_YeOS4}Gc
zr=GJf4%rt^?~d48{i>+JI%jZ%3=TwXuNvy3O{*?hLQNaqFFO+OT<QGzp11b|ckO%k
z{$SVP$d<z|aN)8ee)U8}$WRhB_^dQBXK;oL&Oqf=!=h+a?KkT#)J3Y60aH!LQ1SoY
z{6oQQJ>j;V&u>0h`MUQNpZC)4D~BRY+uko53V4D$_s;D+5ZZYlc>kfu&Ys|r!N|@*
zG<Yas@E14k!LYsp#>=*F&5BFSSK2Nw3vS;RUb7D{%QO1Z`Z+^s$WS`9**ERDYG{gD
zif~LX0oZx!Xt-g0xO{!oQZ~N+n%?xBZEEesrmNOP(fpFLdnfl!9gpPK`Zahm(08%y
zs&V0~J7#S&U02v}<A&>nB~vYd?sKh?!uoJw>+~M~`eYvljzZ@}Oikl!@jFTkR*P?<
zIjk)WsHU^0ivzlFb4R$c<LZuG!QEYv9S4J)E4;%MH5W`gaQYa0B09s<n;zfv^w!6>
zPTVuqc~w^x%`ZONHQ6<nzbKTyD3ag!5yNH-vvBM|efvdR>x=s~Y$%zRV&xlPopq``
znClE0ok5-RS9;UqCmw%zYS*-5w)0APaL<A9ha>v?gR1-g^wACpW7@<1=_3PUItUN=
z4Dr#zlpm#;<-_o(V&LIM{O>j8cAf0IG9cft%H5tN`$28)cC%0Rw!*sIE_=I32K3zp
z*6l^IpD1NOLptmBGDWCd29$pl>ce7k1|Ad}0t9U_rs+IS*FBn|GwrijfSjLZa=kqi
zd#x#I8yr0VmFNmaS$~RL&oW>bUHu>#uf=O%rUfvB&efEaYK`Yo4Pq`?H&~*GCkF?e
zzEshzRbw*5Z$Tnm0={~S9{x3Wb!Oci4n)pxA;DEjT-Q=-*gs(2FOmE+l7D63{EnxK
zT`|1JGP=5Y`n%ok9#?;VSJwqrTw0)I%qkH-oW)v5P=@<I81mxqq)#R{-PEb%i*K4T
z<(8X82DxS4v4fR&;mJ~#X<jL&Rg6A+UM;3IjJ{%CE2ec!mUBKsOlL9%<Gfx>8vq{u
zB#Wj$WavZ0F;ROD{7e4G*Xz`hw?u5xa0@n>h1jGO?^Y<_)&=b30Buy!TNQ{-=8z8F
zUMOOe+Bin3i({0CO(I4~u}NDRHmScAn<VA#udCvi)!&n!xJ%hfWZqpTxy+Jc&zk^E
z{nE2g@*|cQM=I1DSlj`_@rN^OMxK`>;K$#bxCda(+6T*hG&srwXQzc>`S@ChBn7+_
z<7)|$QXqiy(b0rJMjEhU#qw>KN8=eIzNVnGJD^A#%cv4KANj?DosxIhnflSk*#sU(
z>r+W7A#sETsv;iuf5uiye#4T|hj#pD0J)ZQK#u?4U^ha9DETgE9Df7KQ{dYt!n!@b
z1y(njM!~na;)YOh!(4H5sJJ;&-11+5-)2sDx3K$Y6Vch!?Fg@7n!2M5Q>n-hqss))
zi?w1}Zm4GjPtGAa=Kl<(05cEu_rrYvI2Y$jNr8`(%(F8meXmH_JhJ4kn%SR`p}(q1
z4Te}|iXUXS#XxW&s%=088SdUO2)zfp4vl)?U?Me479&d|5=17&b2~MB-{RR{Cw$y!
zjx*z~gJu_PTxwt?d!5G5F@<Ze2ViO5gpzB4B+g8#6RJcroA5ORYIp~xY-I4{I?12e
znQxuk&9X-Uw{1~K1j!@pD7p8sn#5S6LhnA-sQ3^$|JX7`J_P>m1;qE2Vp2R-On$dp
zP3pgVZV}bk0?ImJ>ZFpSsF{kRhQ^UxQ4(5aBl7XpZ0XGU@iDgR8s_{Q{h}0W(~7iz
z=|H5PRni&ht&U~D*-JOvvFPr?vpccXRNO(7xeCcMr1&d)*lIHNmFH5x<L|WqJZ{ro
z5R`G??mW5lX4NwatpYara5_wWUY<i%>_=cwOYZfnq#Cc5{PtpDP7)6E>O5H>p8m+s
z3M_@P6ta`pp9?xpz8p9Nbzcr*3r1a{1g<}A!lULs3+4}~Q?dkgf`?N)CrPAPyz`}^
z2$&*%DEB3>T}AN>Z#pOg`*ef|Zu@!ci3}kFaLt@THK$3S4+$N&^B_o=1S2kHB-p_b
z;3@+kXwb*_^Qve&0I#y^1#K^z$WOPqFCXzNZ4wa!^bFp8$#;N*GUEuC5+r5{nSgaE
zgiOG?)Bw8bAx96$MHZlZ*_=!Sqx>=+4)H}F_$9nI&4)<@h|59`LFpi%r3Oyt%}TY>
zQ%pk7S$)~i;YLrX*cOW7I1=eZlL6l>;{fe}`+TbeIcG!%1E!OzWAc>WUWczvvnT0B
zuxCGv$$T~Aaf&r$4ATe4V_M@<6K6ufBB;Zqz#{`^rmB~KYBN=xlcqYyQ%;J{8@rQ(
zQApN|D>Di?qU1+2Q;kpLB|6KS#aWVCEL4j*O^aF7;!9~s!pBK1W>E{Dt|gwA)B;z`
zsFq%6OD@%7Nz-DviyJ%B+-Rvx2#PCRCs^W2+fp7)IP^%oEK$dso2DxFE+|~CkPG9`
z8Xt#ns^GPzIn0`n17lJTW76og3P$%9!GPaWR<abjFAH#2np<Z})bZNVblW_(J4TBY
zzT0{n21ThlcEQdo1UqL(M;&1S<ukgg>C}|T7kU;YWOy3M<-kG(1p%ArG?Oi42?oJ<
zG4Ev<UHJ3n;Ww+}l0cg`U;Kzu7x)T<0&y~83$Q`<!i4GZ@mM6}adcb=VtH{|Ijqbn
zN72tJx05S*PMTl=e-sG$;`K(ZRLH0ESYqZ)@8HyTE8YuS2VZ>_9VXe}pQYHilI(<3
zZ=R3`Ckka;IaeWM0}fvqKT#lWzFEDUb0+!ng}kJ8Wm0<;ojadP8(z0-f9e+P%TT*E
zrM(b6n8{VAsmVvrS(9SmXeu>Ds67r6y;!eLPVaaJ2|SL|V2x0iK5Y)lIGRImDaG9;
z6!H>I373(|yl~4T*@y+S5nsM*BWh{cC^W)>F64~#{ee`YVB#xA3pI3%FoM)mOQv#6
z4R?G5ts(<Vj>%yj{|JiVBVhVgqH7%4LUCfk{M@ebeSX(?RwcAOUIJ%;{|&UJ&H(FD
zXMk})H}eD>W_l2Hq`$tJL@M=kFuZ~uml^gle(5RS>xs)+aS_%pDgsvu5Ft7B$(<6M
z3p>X2b;lRgr6NZ+|8HQ#SX(LN4Zwvk2uR&^?jADSrXYJyFHnfVEje|%p!!i@<Uc`z
zd*zsBO)6ZaTV@W6{sd%f5xq*W^{)$$ti>1$*QyUF94k4#NR0mwp&gSv<c0gL-6y&{
zE&y%mE(fEum_B8mc%ifgrJw)^-KsJDB}k_N$+3pGJ}vq3*N(1=DLvipV-OMpOuQMn
zX_YOI`rsX`_aTxbj6J4qj|bvK6wDrj84m7&Z2fC3S^sjj;{O8k7|dAltf{}X_+m=;
zNKcQ;?T*RsZR=dKp8t0g_%RS?i3l=JW5xv}1W9VUk_-?<w3)_`zd@F5Na&V<hSn~8
zr6@Jsz2P!UZ|m|hmLdP+T!Bx-@15AXlUN8Nkl~l(>k1^RfW%}7SMY1_J%M#I&eG3<
zq0>=l7>RJUjv}%DVp{MejEmmGy>JmK1lh4Jc~3uHB7^IQB4*9Ykx`e7bfH(pjfDcX
zIk>~29h;dfr}%U%Gtv27;=8Js6I0~pFXm()L<8thQ}z$_-~}A=(6beF{8m)@7#6O^
z)MZGyaSjs^?%OFK-nnGulV;@-7(nj53P8L|0Kd)&TC2j^s(>&%60U293!`UxPxsE5
z>qF-HsA0!Vsl<{weh<JD7ApW{<yCX#O`-Cpx$@Rfd26J6C0-CN2f)*>o!EID5aEo;
zj44+nx5h8OUbP_L`eyHi-dXLX?UCB`k*W=TdC&~Z6;XrbOy=p#iIMkwhBCbLTMkHb
zhUw{!$2)EmmR~Qc3|PLg|3kSnEBj-qJR@^nhcL9#zdWcbOt<%VxDGHs%QGz#4RCuF
zVeYDssS06k)7jj~+^O<FO~l$1$!SKITlSLboC<JfNu+2Q++aqSyZR>6lEAs)CUmmd
z!G<Fd^HGEajcC%uhN+RDeZf^-Edq>jGpZZOxhI=^5p8W0;p&LK>|$x)=*s|EN2-=b
z3yb}_s4WlhX=~ndJD=VCY#v;KuBr8BBD(21zxzGFpe@ByJ42SLsIxXO7IL;sWL~$I
zO%1;4x@uqkmhsa4k+#m@p1t9=y>Q7azu|ga%Us>6P~ECa1;Kl_h1#}<+x7wU?2FXh
zH>HEl$u0R}!h-kr2L}d2_YVc{f9QI-Gf+F56{=bmDPKNu4_u9&7&+~YmR1H#=ax;V
z(43>M%CFj&d}q<@gKxB6X$vpg0#I-8zWw3t2e6ZJr+vj2?2)p@iFHv+MW8WcSr{#=
z3RW)*l`WspVEw*V%dXm+zq8|#?Ts$5JKVZ0xa(lB`%rjS&%8vQzxcXy@tm^-T0h%z
zsr%cl5$A>}#r4t!fy1wIS4)>gH*bHxamS_hS9@k1uk{8ScT9Bv`4C!L9<^7@*{ef7
zdv&k|Zj`SG+Yer<nOnU*w0e7RM^|L^L4W&oaIoW|^eS9}E-9ZYSrIB(G3$wxv`;9n
z*-N6ejnmy1`U3kWI<8sD0*<+=W#Ou2*UPIeE}oXnEo=)dY>QN{j+CznmbLpk=(#{$
z$X*vMDv#!sM)RG~()xKdljmD_lac3T`&BSR9hEOFJ-2kObVaCiMbxw&J{(7O&`<=O
z16cBg$qjRPO`*J|VDrI9UN->Ac(hOyG8Ek?t)VxYtdY`X;ZiQRl8aW<P0P+b9KEGr
z(|6o&HU6OK4dFwjEXVw@RFRcEpUL>@nnA^sHDsuU!-Qa7P0&&kG}I)HSuPp_dtQzo
zwOEU%iYM*#F8-XoCS<P(?26bI!x@Ls9yFFl?QmQY*gJiE`si$5uzEwVXk*a6F=*Nt
zEv-mz);(#>s%r}RK0`Sk5nNm|t$JBJCWt1L+Y07vwIN$=;CRHg#IL+f`j#~5_Ubt2
zC_U4`59i4F6IYFO*W>r}?}-#F_W9v>%YLTgbjQ?&z=>dK6P&8uD69-r1PdCVsJ1cT
zoohuElg7XfXuc&sSXdXd)CCQ7=%y24efh;jfd^l1oox$Ow_d8eQh&KRxb431>ibew
z7nS%k&;agy`&FYex_s69j<)Ic^PK^o<8Sr_9c}(CK<FT84%wS$&6n~c_O1U#*WSgm
zcb*vdQbz`xq<CcT$B%7{qfQ)zaAuL;5Us2KhHhR8sXu>I#4PD#|9HK$HdVejTEFNU
znOMH~&mWDkOxbGIy&hJOAGRoWEtLI8A_My4mb_h!%sWjryUonIrP;f)WbZagApM>q
z+qb(x_I_i|?o8=i28%RH4h3`OoZWTOxmp(JEe8y^qJPE#1H}*TI4YpIG!CFg1zKF?
z;E&Nz2rcr_G8)y;6h#l=fOx21JkiKNUX2*`PzD+<(bP4tg`P;z1)2XEzNVi?q=Y6_
zCt@yIpXU0yQGp^&0WQR2CVDmf)-#d=qIBAXFLX9RaWonTRe(&MMmPx1r3W_%Z;EkE
zG1{MruX-SE_?I}3fc-7};RTTI(E_sn)h;<bjv$v_ZS9lE9XE9fIGr%4;g-31vm|vU
zA*RJM2{A36Nr-9jOhQbHXA)vsJd>d54;lIp&m^*D&b_vmElwN+pt)usF?rWO_b~iH
zSJ!a&5ddfLY`{VqUN2Bw!6>DOTy8Rx{@1%RXhn$_?YT(ob(iF)64ExiSV23ompnB4
zXu~mRA%wa+u*LLR$6?G6uX@I$BYZ#Kk3|DW;?-)uy-pI8%pCu=pDm~1)DRZ-V!iZB
zm@dqvL24(dd81N6L&9FN?+s28mCRgvqg}#2O61>j?!j;#G@_K4+C4PF_qcX$-^@RV
z^+%DwN5=3E0RgU5U`(T4DxVH6jCG+QM)VRj=o)$Kdz&P`k<3KC_ohTk4SgF6`^oc{
zE$je!?Q*$~8ZAp};v=XEb7^C5(T9!^+e0;b(H^y^kB4+jDgNP^o5sE|HTDev=#VLD
z#oFk_m?0U*4wHS~-!J)CGBf-A)vT5F7Rw(;x#{h26XRQLteWh6t0%#8@^+p_N$9P6
z-~zSvho7*%Pm(U6n<^aG^ybT$rtWwHY|r>^_?v`BF_&&TRB77|>PhNTG=oPyY2kmy
z7YhIBM@VCPbPF%4$JAvK`0;XuUJ7IM2D$IaQj&4yN^by-rD|!<YVnoM6LcO@@Oafk
zET_GansaEmPV8!0pN>;H9n!%{Q*^{mqRd{h;%&1pT{5+f)<hFO)xh5iCjYzzYs3#(
z=~$v{v@*?A@TtnwkzYY8ljS_^N^wMswo@lO!NP5&6jyx6iwt*@@)}s-%>3-**gjM`
zjD&U;4oI=b9>df)l45K~YKk*MUSf{x!Ez)&l#rwEoU6p7Gbg6$>N-5)8R1=BT|D$u
z{CMvbOywi_0jYm?<+^p4#4nDg9d;g5vq<R7NkzYauNEXZKt5G19~k0B`duq{KPZC#
z8FxSV*1Kg}M<lHILk8(5!*VOT=tBm`$IbhsY!?e#h>sbX`glyyF2kIhijNtZ`nW@N
Oh!uJMjiD*3?f(G>xneK?

diff --git a/tests/conftest.py b/tests/conftest.py
index 70cef40..8b77ee4 100644
--- a/tests/conftest.py
+++ b/tests/conftest.py
@@ -218,6 +218,46 @@ class AsyncClientStub:
             files=None,
         )
 
+    async def request(
+        self,
+        method: str,
+        url: str,
+        *,
+        json: dict[str, object] | None = None,
+        data: dict[str, object] | None = None,
+        files: dict[str, tuple[str, bytes, str]] | None = None,
+        params: dict[str, str | bool] | None = None,
+    ) -> StubbedResponse:
+        """Generic request method that delegates to specific HTTP methods."""
+        # Convert params to the format expected by other methods
+        converted_params: dict[str, object] | None = None
+        if params:
+            converted_params = {k: v for k, v in params.items()}
+
+        method_upper = method.upper()
+        if method_upper == "GET":
+            return await self.get(url, params=converted_params)
+        elif method_upper == "POST":
+            return await self.post(url, json=json, files=files, params=converted_params)
+        elif method_upper == "DELETE":
+            return await self.delete(url, json=json, params=converted_params)
+        else:
+            # For other methods, use the consume/record pattern directly
+            normalized = self._record(
+                method=method_upper,
+                url=url,
+                json=json or data,
+                params=converted_params,
+                files=files,
+            )
+            return self._consume(
+                method=method_upper,
+                url=normalized,
+                json=json or data,
+                params=converted_params,
+                files=files,
+            )
+
     async def aclose(self) -> None:
         return None
 
diff --git a/tests/unit/flows/__pycache__/test_scheduler.cpython-312-pytest-8.4.2.pyc b/tests/unit/flows/__pycache__/test_scheduler.cpython-312-pytest-8.4.2.pyc
index d386fd940fc62706bdb90391cd9e11d399ddba58..f1851be00c460b1fb312b63ec7fdc38748f56694 100644
GIT binary patch
delta 1224
zcma)*TSydP6vyY=%j~Z1ZtCu;xvTDaNvC$ZnNez5re>u^6ctp+>Q1HY?$|eLVG8-s
zLj?)((S@FTh+tp3;6oG%y@yZ`6hjZuTTcmwNf34Zvse-ZeK5Z{bI$oL=YPJr)%>x^
z`_kjdlW6oDn>$nPy5W7mvX5ui+haB4yUA`#S1l9lqF<7(SuzZH7zs8cO|W}xiXD=&
zmcFbcn&i3GAVroYr4MfZ9r?Ap;!5{>U)5`0bovP4l{>nCnSEIsFQB&}YXigTV8)QS
zni=J3E{i>mwXHr1Wf?D|myX>gc@dIb9iyq#SXWZJz;RYDJqu34(q(DUVs*uMfIfJ|
z%tMEZv0Cxe849i=k6|4d+w#pD*L9U=!nO4yV_OxS$HcsIoH<0&6=79k%5_Js!0bj5
z%@eFpyvQq+%}r~?!@`L8k!Oz_q<B6(`Xrr+DtuQ}Gui#sX0yi@B*MH`Xo2udXMQhZ
zff?aW+q?c(JnqKUb^t}`Rzf(OtD5^nf6;;NdIU*-$t<#u7sFf)loM8{#LY4eld}%d
zN+72Ttgu)t8tkoxiNo<)g0V`^Xgq#e?H`B_o>kKcz6Rccp>#&&=i|x#)KGdfqw0JY
zX5b(SGaSoKMcntP1<;vCfo;Hc5%h;InfV*>y$NUlV!&~N;^j@S9Y8a146p$$zz(1l
zXa{x!9Y7nf6WBnYbvj|^x(BNZ*ds~enLot#inso7eGgo{z&^mdSWr5=a_r<qqB5`{
zlAr*@(Wn2>=NT<<9X<YDyl9D@!h)v(4?(f!Y<LZMFrG}RiQnxMm1X-`yEt1`nL<kp
z&j?pf(e>}An|WR}Y+5=wrZ8@{N5PVR5$_YOz9MsT-x4HYbHhsA;-#=`eOg*oTr1R-
z#pkk;qko9{OGQdG1suj&jesejDH*A_Qnw-c)Ln#S*&x};VAOt&d~ISXSS`0b+V{rR
zCY}UmohVVU@lG)jDwT0Gu8F&$2np~!)WBNAe5j1cBEP(Py#qn~UL4wUtY)g2ySVrb
jzd2h{T4FS*w(@atqP)&m%r-A<E@d6;%T^DIn2A3DF1iGR

delta 1308
zcmb7@UyKt~6vpRH+u63;?b<(Emu+#UEep)1TV*ASvTR*pUC0s&0VI)-kkSq;-FBwA
zGu3n@vWY%Od{A?vlBfxfG!hfDZ$=(?77|QIG!qkoKJf-wf`li}cZ;DWzBtMJ=G=46
zoICeBXa3mz<!tolp`oxs*V$_~m+u8XkABaLAFdYzg+1i^f_<f2QtJ%ye_t2ach9^`
zaed-pEIHg&%Uz|bdRn_xtGK2Z)o#sirnjD~DZfRMpB}z+`10bNNdEUk?w3U2$_c{l
zNMQqI%UwT@(bLoHGj+4-dKx#~Hn(^{<Oe28NeXotkJH1!rfWQb<j_L9+3YMf?Du$x
z)=|1Qf`lg@DUVe(G{sZ2;N$C`420NgTgmRS)%e8rR%eId=yP*A%$<hQRe6Deo{v^f
zqZP+7xhrEchQo{EX7GJYLp&`$i=|bb7xmC(Z5*X%L@+E^TznHA)#MjVh;IWEDnBaj
zg;QZ)U}{4lJP5C|!6sv=bvt7HZ&^ojgV<^a7$!JAg0A-@;813DiFVD3Yq9i+qHCY7
znXQK1X_}UcBl8geLX`Q7FvozG2z^R&d78J$If1AS^t6MO6+gzS*)1?-7-hX-$F+Io
zoO$|8rMhBTHNH)h5~<W)WElj5c>~S!R@*flJ}K%6^95+kr-0Xi-QsRSzbNx}U_A}&
z1d6~Zf)VAju%SN3H1c-<KQITBfH#1Bzyk0VFb}*5yh5Nli?Dk=gS8(xpeW*lWQHw?
zuao-JA-KxGK|szLCQ9$W=6i!@JQF;a<0hr#=ytBqU}Dg7Th<Qz<$vCL!3Op9V<WQv
zH&Tz)!a0;*1|kH**R$dEv}&c%Fl*0SEdJbdkd?&CW8)Xm4=+Ho`L5~tZL85S7?(Yn
zM5+If@IHQOL*sJ4Q6yng&v)K(`6gKYvTd10s88bn+%dUF-xxU%`*^?F^OPs$rMIQB
zD{#yJQdy}b$=fezot6%M(|`0NErpRT1UUI-#mRJD+jVv6j(?Z<FnxV1PHXsO@zr>%
zLsR4y582j=**Q{itIP5Lyd}<NvTUFDIP)r-6F+6fSU~)m$rt6k9Hk1fI~*HGt$Q<#
kAN6T)Pt&fo8)k`L5ZgCzOC;I!Mlr<}*rVwomX(Qr1A4#~ZU6uP

diff --git a/tests/unit/flows/test_scheduler.py b/tests/unit/flows/test_scheduler.py
index 3495d92..ed3b8ee 100644
--- a/tests/unit/flows/test_scheduler.py
+++ b/tests/unit/flows/test_scheduler.py
@@ -11,10 +11,9 @@ from ingest_pipeline.flows import scheduler
 def test_create_scheduled_deployment_cron(monkeypatch: pytest.MonkeyPatch) -> None:
     captured: dict[str, object] = {}
 
-
-
     class DummyFlow:
         def to_deployment(self, **kwargs: object) -> SimpleNamespace:
+            nonlocal captured
             captured |= kwargs
             return SimpleNamespace(**kwargs)
 
@@ -37,10 +36,9 @@ def test_create_scheduled_deployment_cron(monkeypatch: pytest.MonkeyPatch) -> No
 def test_create_scheduled_deployment_interval(monkeypatch: pytest.MonkeyPatch) -> None:
     captured: dict[str, object] = {}
 
-
-
     class DummyFlow:
         def to_deployment(self, **kwargs: object) -> SimpleNamespace:
+            nonlocal captured
             captured |= kwargs
             return SimpleNamespace(**kwargs)
 
@@ -69,7 +67,7 @@ def test_serve_deployments_invokes_prefect(monkeypatch: pytest.MonkeyPatch) -> N
         called["deployments"] = deployments
         called["limit"] = limit
 
-    monkeypatch.setattr(scheduler, "serve", fake_serve)
+    monkeypatch.setattr(scheduler, "prefect_serve", fake_serve)
 
     deployment = SimpleNamespace(name="only")
     scheduler.serve_deployments([deployment])
diff --git a/tests/unit/storage/__pycache__/test_openwebui.cpython-312-pytest-8.4.2.pyc b/tests/unit/storage/__pycache__/test_openwebui.cpython-312-pytest-8.4.2.pyc
index 52b6cd563d176d61c7af92e46589aa7b99a8abbc..051c1f3ed8874548c60614c38b79399192c10efe 100644
GIT binary patch
delta 1977
zcmah}Z%k8H6o2>i@_^ey8EyHe%)*LVfl4XZT0}~%7H}@B6Bie^T1pWZ2;Ntwm^n85
zU^HaeyjilT$-XWz`<Itx>U0?aW}Nz=aR$@GNU|;2$BOR5*q5DCIt60bP2TVR&UxqD
zd+s^++&=_4_X)|nm6yjP7$f`d^dA2<?>Cv;)*i`mon<X*myiB+VzR7Eyswm!&$RQ(
zi-Z)2E7>y!eQ!KI9F7k3#g4?q$(#pl8~7RFQ`@!f+zN7NmX#-1`7E;~m~EC-Cs_4e
zRy#{;6SOv^m&`%(&%7cTTIOi&g6agn@s^;COcD|-qm#1V1HzQo5G<$D%8q;xZkS21
zlHRZ=$jbr616E9mw7=Mobd|V$t;ITdBB=doJRw8m(ZWDe2W-YSBh(?_-gYCeNA5ys
z07&L{$9Ug6vF>nm=txiBVcv*;UJw^;C3-JXD?-ybQ<UumRt2B>P#ZLTN5)n=w@EU0
zWX_#3NLh{r72_D+(veFpllB&R#qS0>RcGjs>D0EJ%^=*|N;<OXO|Js{7a1{1!RNoB
z2Xac1$YUAUZiz^u)n1`pwT!cmADYBzr%RVL5fn$QrxYJpa=%!xeptK{=`H|O2C!N=
zuEN{I=M{tccBJVP?H1SStA)REL*a8xecBI|9zsmw$xB|+AvW9A7evr^NoK_%TgkfR
ziA^UmnbSQK9T|k1!w+Ce%b%t6Ra_#3@D@Olgn5^^Z97Vu#P+J!*fG%IJyQ>87pm%X
zU907~STfcuUa?fcvsBk~wvew#XCwXE?*=-x-q7ixQ}v-{5bkXzoz3)Kor2th7^Py4
znaMYr*ZxY5#RfaC82ua4-SN7$SVt%H;=1#&vJXu7ezB>(okT>uK1jll$6(GuP}^l5
z6na-FX%khhF4voAxg_5x`VjmGcz#}lP>N87&?~OG+AH@UJqchpa|29Cy&50lv2a%;
z9_{5=gmX5>Sh|M&Xo_+3w-Ml`EGrO*_EJ88+UJ!itEZ2v@uZ^0pbNVByJ)usAgT8a
zkA@?v8sqUsKJ--6GsFiYad-N+xYLjuz`7>$d-?`qYIry@IxrOJR=FFOSzc%ELETn_
zBM4mpNjeydM|hJcYuv{sK(QY_^|E%n@vQtmO;+H=!dHxtzvme|G57I_!JLkJLq+5o
z31!pkfl8n=>+(X3&eUcjHtb@cy0zU9GSb^D;07T<NXSeRvVxrH0i!xtMv}y+$4H)N
zXFL~IyA{6HQo_U=t!Kyq@q6p{1wQaxtSz38hs7oTVdu+8pH`H=hhhxigmE#y)~b!e
zqfVDyP15vi7CUwvt4>#QNvDAWT!!b=kbi^?R`aaEns9^k{^=5&261UQ-JA<sAjZyv
z9t*4fs)@iQdDTucN%@XUr!78e7{_>PWynJ&Z6xHNlU05<2-9l~At#;QxJLpZv5|zf
z(1cw<?gSK{2Fvy76J&uqzaV}J-Yvss=X(*b^*LSxj-l~`;>)%Y@`d=ht$ECG-&~Q>
z6%t1(M^e~)F0jWsNw%b9)NPXFoYQMQSTjq^31UvkCbDP`bH*N6#vXMwE9{GiV-D8O
wf;q)-eLb*@J?iSCD;z8t2bePsz%mY~t6O1Tk_iarOhCZW_K##>JP*$MFB~4<yZ`_I

delta 1868
zcmZ`(eQZ-z6o2>i?ybDGYqxe^AX{73jk>XqcBNhE7%LrJ8HrS!&Y*0iD`Uz&xUXP_
z8sab-RK$2=2xt_di7_Uic`?pJO_o8(!iX${%ru%TA^v4z3j1%0@tn8L!JIF-zxzAq
zo^#*5zjN<>{{!+HC#D-FlPtg&IzMwb^tI`(NG8;KVp>Nw@_Xiu{G3!m&Z?KC3PQ~M
zX8tw)iT)SEHi$PvQ`!k{>DZ`#x=u&-pRGS#KPOkt%9Xce#~gLcQb*Px*rMdm`;uU6
zo2QONr3sS8+oJ2qBq31?ofN|XFs6dWsFhxoc2Y2|%OqMxuNx%fR>Y)^zvs3QQLQli
zNVR2oNvrCzoDgA27mFg>VlXRfKxhPTn;HIwc@Vq+nS%Zl8$6!s?@f*j9~vBB%{Wqs
z;Nz9nGRclK$ivp890%%xrp&2VtlyB6Yi-IZ*mmbOl{E@^&P4_PJ-#*8MkYwiN52dE
zflf6VV*xr9>hOXw-9Tckbh=SO9zaY|$XWgjKu!q)S@;7=(IpV!oRB6ssQzC3p-eVu
zm6))XkXHVa{gl)OBdneGINmLdAngE9L;$;;;Z!WjA2@~#ok%rpcJpoCT7J=4Q?zF2
z4z+w!fRG~oWL1#F_?fEeXdmXTNV*|o=^sfR8%hnQdk-a&=@B-zN@PvcjD9(a_22}W
zyk&NzPay0?cpe}_dRc-uxQ>z_zvS8{9|vCuni5z4b~WmrSxfd(!Cbd=l(Lo;)$6)_
z<TB~5rB}j!pi|Yx?s_`qiF?7g<09Q&dZ$`KUJuC6xJ$*4^!(T28ug~TTF)=oJv#ah
z;UUj}v=0~8&A;%(NFQJDM9BeAE$ZA4ZnwyGL6^xNO^h8GN%XH0`!nxB?{k>_km6`A
z)d?BynUx@vBdkXl;4RIu$~{P50dQNH5xR^)0d-To2NUV!Vb;elH8%yd8V+J$6~YS$
z;|MDSDrYaE<I#i9nt7qmTJ|!I_y9779iwBt2}Mb<w2uw*kgp=rg8qU-gGW+I@AB^0
zR?K*`V$6@e0KyPL0w6<&Qt1TToR57^$!~+>X=ut<>R-OMMC%$Q<d*`rPIv{v5H=o+
z8_D-%Z!7&F;skoF(i9iywJrIG&AVi9-Pmr7=g}ECvIUG=eiE1It$+l4Rxrek{6U~p
zp4Ttm7hYIc!Y#TgwWsA-tZM}?u-Krs0$*%DO?vq2;cqP~^}yA$1H5bJKvNgef2+V=
zMYA8^gn3CQyKD34Sd-VSWT@6#`Q4o_)oL|Zk>B<o<#C#`2-+Q}u_Fy4XusC9eFMyg
zOX6oo`E(>Dp9lX4G-XB&bbKlP&l^-wpSui8PY}L#<L%CPJ(;W`@hUp$3j4vh`j|0Z
zL$7Y$vlWcl3KFlQvy~F^8bmi``1rFtfQ-aa>0@k|<%0nO+F61Doxm>eq0ZZ0eDxVV
zkPNRY!-6whE5j?oOb7;mMSW;!r2p8F)OPkcS7NOvoj=<gSzQrvX7z$3-(Lr8K_`gC
zSrL7Y3!?tb4X<sOBeq#$%ZgUA6c2qa9#}3OeRZqiONetG=FfvZE93kIV7Ykod6KIV
higO9j=MsSB642MUD!weYAn0=o0;a{^6M<<P{|6C7$#wt$

diff --git a/tests/unit/storage/__pycache__/test_r2r_helpers.cpython-312-pytest-8.4.2.pyc b/tests/unit/storage/__pycache__/test_r2r_helpers.cpython-312-pytest-8.4.2.pyc
index 46de2da0fb78b8be6f3d1f3254d4288986aee4bf..6728baddd42032ba1c1a423ca6649a1bb3770b72 100644
GIT binary patch
delta 6208
zcmb7Idsth?mA`YZB#@AhKmzd)aCswRFb4Awwz07>#x@Y!_yvhgWUh>5V?;*s0~Lb1
z^>)ej+pL{w*YP&4ahlflm*guB>Bjl`a@uXbwB0mPphi}lG}%oy$=5#?8)uv3YqopN
z2nlf7t@k?l-E+^JIWu!!bHs0cOK$xqN&L0JpcCNv`mWaw##LQSH0X$p*>o?H%!wPi
zDnfFZPX9D1oOoVeMo0;J)9_;=vwu#kA9)-meS@48TtXL7gf3ArDdd!@OHz_Xg#$zp
zPwBf<iUj{uPl-x0=c!L6cBvIJr!_FHQ7oK}13FGgQQ~2KJiN8=)+(ur4&FM&swBWW
zK}l2e@YXBoiUHnMgOZ^n0+Fa>Dn@u42PM1hvl14FPiJr0jBLB{45|3`dq$B|vG<d{
zUns$TnIMqa6MW-a1R|Uj6f#7P3Di6!(xf5b5Mj=GTVjWxh;wX-CNUD9%5v&;BOQV$
zJf?CB&k|4oPlxclbe!0wcDf$E{Dx)6s+K99o}))x{XVZ<3}<#9boMKKuI?UBU!SYT
z=l1k>_fVG;iEw&!FghbPWLML4&_~-5$`H0AIN|}lY5?}t^fe=E@v8;klMjVYP6{ET
zJhnb)EWXkdvSv<OYlGI>YpO}>>VRo=$e2BrA2b$TDda=dL2LE6Ytp(ZU|Mz4oHHg)
zn)3tt{7=0qQ1+GDdeS2T5q-2kn9*o=fIx36#D~XcQyVkcTgh1oq94A#DV!IFMfQrt
z%4}v!0#PJ9!4MdcIV~x6m7;!jPU&-+XVDMv5VWSG#G%xjJeOX-Kw61^N^+BVd)u}C
zf);L5dETaS)TZ(=w^QEwK*x@9)@iL4?P^w^R_w5=BIZO(hLieT#}~T8txyN>`PpSz
zK1prxMRx%Bo8|(^G!pgH{E{(WZN$l=0N{dm@`|4EUS9FN)mK(emu?7_ZkQ}?el;mr
zyg5*`B_Ov3^jRUj=^xu3Yn#@W2KA+(l=LTy&O8*#UKX;+7h2A>jO`s?H)*S#i4zP<
z?+PkI;%%K^kwc~(>7k5LkQqxo*BZ(%zEpRy?sD6;%E|nO+i@ye@{FX(O`H`p7UPVd
zF&JqU>}HV*HNfC5d=Ch8A&>KS9X50s#`d4q=%it3h;1{aAZ-~|fls6%l|r79hSfuA
zkk_!Qsb;2gm~}(qDo_Kg1O_TbxED2$E@C9n7kNwVFPrmLG|0c`EBUzFcThgy?sIv|
z?GnX^4#)L)`hAc@;rJsipHp%AoOBcL{aH<O*%eXaQe>8vmOG*eTe@8*eAL<F>y9qe
z?N-937&odfDaMH@Zoma~v3cHbZuijvSaMO;#<cc$j`sWPagm7PY1u8*LB#9@Ep#8M
zGQ?#0zIk-T!2m=TJaYlI6Bzz=UkI?+)M!NS201U*SqQHgjgXl$olzCcs2blenNdHw
zC6t;momv`9Exo*9GPQDaBTw(LptbBWr1y%^mYI0LnitB<3)u=FQnC_9+h%k^^*S=z
z6p6xupuS-2!Jz(u<)GV;G_9`;>MO^qr}U0@%{d`cdMLj<l+$oqEn$$UG04;yWa>W`
zWLTVdkR5~CaD8KXk^(n?BKhW$9U_LUtxFLhkdii=+1i%45k(cP90$Z`bx>4TH#!8n
z+Mlx_;!!zj6nRsVe1Lk6%*6_ily<)ghRf(4m<4&>1~1x)fL^6N09V9$UwN?x$#Nve
zH4npwfAzc%{!9c7fQWY`03^3L?X2UB<H;RkO_!TqG>`9iY46p&)75Rk>bA+{?SXCE
zgUh!EDmns7b_DWwPMUWGcJB$AI|KU8FXkiGS#GMOKtMK<Lr_rJFE^UpXtS6pcnJkl
zsQj5xQ_O|&LNkQpsq=WZ4>oTX+i5dsj2MGNjL{2>MaOmm!|#Zm`k`1p%&GRFd>X*~
ziMuXmOqy4WZws1h1Nz$k<2V@pct0p&pD>K2e|et8hE*YUBsF>$Dh*t!L*gMdJ7Y03
zxn2tws~erJ@fSr;3N>CHa8j>Jjwb5DLsN8QJI^;bwO{<waOBWZ<hsN#2&?-%PQ@E7
z{+O!a_(NW}f&1M1!}_S!Zm*AeE$9)<&PZhJhcAD9)I<-&Ocb4i?Sr=h;H2;$`utF)
ze8F+fG1fJ1o6Kyu_DC?ZakTYj)tb|FXB*Bmj4hosFAL~5Uf&MDZO2|ONtON>Ns?qG
zcDJ1%!=jfAMhf!zdYzV=X(yCn%$xi}Sj6vnplw;@!~2;(T#nt`WMRwpYE`NsRV?Aa
z$|F3O6bVcBposq<tXA&ib#CEJ8p}0a=VbSR1%psgz48Ecd7&_uhZ7fEhA_|`PK?fl
z>lJIHh6i9cr5oM&(4uMz@{t7H4BLt1E2e6+@8M<DgF{;Z!aASF=j_7*?d9DMI%>{S
z3XJ<VM?E$2R}1%}An(Nxhv+UUz2v^=4pgk2ENTo`8c(+agiNXL*yL$jP0&^|{^+Ew
zd9>}O(KePfUhq=c)w1cz)*$?s+j=WY9<yA^x|lVc>j>sLCbQ~K>q6~&Moz2F8qOG|
zO-q8NC6`wRO^!hQ<~K}RX4FDn8yOw`V(MTs$16cIRDk)^Sx_{I4`Y)*(JZ3sXus4C
zz3Z@~73SnKL2O9!#Udp(0g?^cFbnTtVU9GcTCjr3$Gd-AA~vCNNJT5~{^$9sULdXZ
z>G@_BN^2F>kQ#y!I)!NcUNmFjhLZSfDh{bTAQ1DRMPygESw?)Os8(NclsX_42vj0M
zCkP%FPDq^s^xA5F(N<m-=ED!}1@D65AVYZ4!ScBhffob6DeO948^Sub*WK^+Is1ED
zVYTn*K%a|d3t(e<m_43WW6(ry3m$!atRTJK>c#Ezn41f_N8sDvFduZhOfBvyc}M7d
z0R(x8c&}#d_3Wu_yQXS(k7bXOH*zZjdk+Wn*)yWnkaDYKd!WNL)q7~F<?vX^rSgmA
zf#vI`@|tE~PozmaZM<d9deZZpZ_2#l<(yD)&G;k1Vn@JIaLbw-$g6y@ziG<qxTXY}
zcLf`Eg>sgStAaVzfwbzm;q_D2I^YJ<mcbQoN&5t1F(qr-vNUK}`kecRX#w-PI|4DJ
zgiMx@**c>J@-trk&o?HolZ00)k^p}yWvr8>pXLxi*0`jR{lHd7&au0;^W-V^MAi=y
zE})T5B7B+c$=*Bi_eka-H~^po^B*zQ_i}lj|21xQM8iF@I1BXN!<8f4-Q0WFknm0T
zbx`BwA-Ubt@1nIRB1SfcrPCfy{}u(g^jBll-^D0?3>iM{rYCYTs&?T3{yd=A!qJBj
z@Jgk4X;1|L<AaVMd<9{YEy*d>ECbTJjXjuSTcg$%e4Lo5HGV8xwZ_>>QQJjk<3(-V
zY`jX_LT2^x+D<ZSF>2Fh^9X<j;4T6$AM|VNOwJ$4GwgBs=cJqM$n7GR*!OaOm2d{v
zdIEv5Q+bsz_EO#!@;sCB*O0Speg5B&)9e@d%QbjO({HfP^Sj9lY;Qq($z#9(Q+6XC
zjUBNKH?W3hPK3LUO%~KA{1Xa%6X9Ddt*}7-4?upKH5L|<3#_;BZSpc}F8WqF>I$p9
zJs#@feLEPu0q69v&x?HIhm00Gllih5`W@u+WxvbbFRmq*SyoA|d=a?U;D0X`n^VH9
zNVElaHEL~1#0FQu2I=g0$qmf~oPLFM*f)@WW#{Z}4cgsb3dxzBw!Y7eH<h!e&*OEy
zih?H*zRVhy9LxOm{5MeT6t@!z4$TueDJxJ7y$S$ZkE{VS@1sth<V`|2q3P(6BZHAO
z=(8~TGnQ5=gH0W!8ycVzgHM5pzqTGD9Rf{(4_XHRe-_XjKJKKw-f+?pPtW0Qr+2Ww
zr@M!5HqxoFiP9?L8zAdN70~$y(wDH0OGnASut%2`kr4aN(!qkSp~4ps`2Gr!!fc~g
z5MD<3K3i92PyR8GxVrZlfX`0~clB(z%$k_}2vMia3W$F=D6yx@YRM87F55@;Fh_YN
zd1Yc}xh!dZf_kpAFD<_oB^{ND`gg#6mpxrMQOwKh&rs+XfL;7Zg4ah-P6c`tAS^of
zg9Tri7^=E0c5)y53df8H5#2~}X9SQ60<_z;5dky-okW;I_$|T>glU8j!cBxQ`$bKi
z`U4>Ui%GRVC)e38Ym3N76En4YB=RcTw6fXyA<BJ(a2)^|jekS>HTK<=71j5-4E*R@
zpoJx@a;ZNBCI7>Yu9_l0nb^E~J1%y9?e1KDu+L!ZN^~7u>^BInBLrDWV{z;KFB{WG
z-^A&+0Ky4t2L>T@ye{gip>MO%#ukkldI&vXHyYm}?@YY7u2?dlW9)<`zyN)feYm0h
z@Vw3cgsKD_ApmG|19JYKySk2ZV!OiITA*(uPes_p=9L-)Ffz!*zc=4efpISGNM*m@
zl90)bkM{U1F>(aCuw-Dc+U}*Vv!vFoHa-sb-<-W-kzqH|E;ig+UT{CVWUseoYIq)u
zu$k73+#i9yu<oGGH*f-){-gUTCI(Hy9dAYIO;*~LZF&nyv@rb`;ceF0woaW6LZuU9
zZ69jVjVNzIKv#z2`aC`Grve4cdvQm}1F?<!7anW{9PBno+YK}Um6~z-eH|ffXI4|>
z2sqtHQ*b68gr*{O?+I|giUVl~{3tm{$!u_EueuP(#)<cLKByymS>wYMI-a+fly<gi
zdBy%3*k&huh2g%0%B^6(4;MouQ&2UJ;5$goBHRUNwv(_1u2*-DkJ@mlYyjk-0=n2(
zbRRP~OP0QdbI}}&Y=n!W>acFUv7-ab=}a5JJ>8eNaJuAo574jUjC}~XxTj=<c{8Sm
zO|hRU2jEXe9y<7!4g0*{gvq6-frt5jqgEate?aOJgi8S7cn@{=y8E4dv<!t8yJ2Cv
zRzxDJ0Hu~8<gw2E-Rc@3cTN0g|L;Y(Ag{QVk`#8sRY9g$+<_|c23vXH+Aef=Sarln
z4~G+=>2$*HQR?<X8_PfF?{F_z1?i_KDD``eQxO-y!ay+-!*TqwaeF96G{u0RHEdIF
v7TLsld)F4VNF+Iwls_XO0sW#ze<u#fSxFF0Ga~2i(y%oLGbTRh{XqO*P?~Tn

delta 4368
zcmb7HdsNfc9sk|mFYh-HkXLwUAjE(K!52^k6erk2t#44kkYB7(Na)Q^5gMekZnay_
zDSA(<SglysimgsObSqtLi=9@jttN$yn7SRUU9H>BDTqDx^s()J6Jt^TaXdcx-tYas
z@Ap1(`73ncFGzD<tyVDf=fV%4tb5yfT%%T?B$BLn2PO9XRgsTS8d0cTMaI6PsvLw&
z<a71=D3$Ed6fUo#N-v^ajDx8`JX6E+avp6H)o{FGJF^z?>^4=6i0A09XfMkvLp<>|
zO^ujW@e(R0;nlp9eoA=_FQcEbR?e*bK8rk=l|a@cXvt3P4wQ4ysAG|pWJLcVLr&ch
zhCyR*h`{ec1~I!B9(mCw2Df@y+`_X0BK3<>$YH%f$+c1OmzjNRyNLMp7B$O@5-7(j
z^0MpY#9tC)5%ZEaS<0e6N2G6ZVG1!U^IQ}!1GzgIcjRY`ljr4oIVXA(g>{xNyaJ-=
zMEEr?NAXo&$uo`OcCnWW`;w}7hF9N-uB%K>-qXud??$+mjl{uo5M#R}qBlXqYww$r
zM&^=qeAIn&GOr9rdBy9sB(EV^??O(dUG9~5rCvE7y_aiOcono16Ud%2y<AdE9YsuS
zh>4`quJkJLS3*=cF)E=Hq9b&~85Vn$;Xqx;t87=vnMk_h^i+cW0ljc&JC-DOP(@X{
zdYrggh<iYMmvE=PGz@hlKwi0F9>d`0ylP$<s+DG(6^#)8fE5L=@@i;@NW2<e71GeU
z@?!5%dN5MXt7+G|Se|LudbN0oR~xF^8~PXtwNx~I9UXE`=ha1~i@jQK!Rw*AcN$5;
z$MSJ|+41cHGfpOw(h_D8Ll-TP<dw$cCr1(xQX<q^&d6X6G1biTc`eLlu9|5<N4XYc
zo=}D7QX#T0c3MZ9I(JikF7LK)Y;w2+4~E9Z3n;XSC^IK0!?u=s!LeB|vsHLL<p*U=
z4#CFT1RLeFu}`&|xsZHNYInN?Y6C9^DUIFT*yykePPePx$$NsDh>Lo=d!tKeGt3LQ
zBz$}}(vhK9Qx47nJw<&)&=V9lx@}Zd;q*9N9>M0aJAz_iV{@Yer;x1^r>}{|P&5q3
zNk|zl1`AOxM+<c_&U;X{-b2G^bT;4`kX->{sz@639s!4AR!3adLwa~6IX$s39xnoE
zh2R!!jS!m$&!P-Z^v(@>G89wP@d%8(v~1sf&3yMX6VRr0&-H6fhv!|%oO~p|M>y7g
zxP3Uc!k=3)XsJB=xZhIcoBWv1xX7nV59su})H~F}x?I05H;`c1y|ybkFfl)nW;`T2
zAnP&ovx8|xBT^>HdW#W7MUN_&cw<0s2&Cjvk?!ROQ~{Hv<Iv^<n|sy$c+gZfDix*0
zjc}5T=rKkTA2Y&8qGCogOmuqp+|Qy+Z<JrtnF1-3_B*?rJ)$0=S2!_uKy*fZQaxO<
z(qFQ2u(;Z{y4GJ@>np1BO{@1!Su>bo^EKH0DSW3gkeIsP+-2^r>{SdV7WJ3<6K8iy
z1F6RS9j#rhJ&C=m2UE)i^8BggovKSkzt}x<|Lm^WJ=sG^GtMsVl#R%kq|88SW*{w#
zhL|4RsUA@<v*x2tQ8@i9zb>mM$*-F>B4H+)4ka8&@L7rm(~CPbmtxYtoW0;|%20LP
z(Cqr2lz#M?xzOkE`1F}0Y;>&Q^Z1V3%ZqA!tD1(~cxaKQC+pah!&7{-77k5*bcFUW
zdX(L*y_}TM?S4xbN-91TGf+QRy3Dt-`m@sNE4j1#pY-RJ`jWFRr<#3}3s1}&N-Z7W
zeN}b-`E>zn$$;K(oqs@mIo;yRE<Rx&N-v|#1L`Z*f^PNI)a+ivfbmRD$H|=Gvekb2
zm$&-M9BZ%sZNqWHa9)K!uVOH#vRe_TTh}c*q&}b?PAl}M74|>kPpj}%*7(y_jmqvU
zr)g?nQrW1OgS8XG+KFN9#8EM$Dn_5y%?`#)@~I|$Hxk1bGKP~2{K*AxIZws=k}7X9
zD0Y_NQhf3VhhhysdMvaRpD9;W#Guo<xtay}%-NJ!Iyjr3SfS(2saZ;&(;}dCTty7|
zz&L?io@yaY#+hgfdEK}V{gTYfcvrcNn!!&3V4}#Z)jS1cDgbo;PLn=%6AWYkEqAHS
zBq}oo$;l(8M4bz`%>V*GEBTGdBFUztC!4%$N=}?3H;$FDNFF~Xp>PWT8$i-a;<A2}
zZwIoJ0@<GwM_!m*PBxhvPz||cu0g*g1(QEkZUu>F0JagiWh$L3wk$+D$ac#d3256n
z^7LdqxoUCJoEB#1N#IPvzb0F=>(NW(i|i^H-124-t|2pXQqgj<GN(}aEXX_$@B-PF
zV-#<p<g?_XoD9@S{+;u8w2z#h@=5}nAVIOm?#2#WL1{CKXM;{H*_tb$ZgM-<79BD!
z!7l+Hj$^!wthdf6>jH8nKqy%_vV*F{4gotIn{17xiz@I=%Gyi+Jt_*@m@!%-<1L9;
zo)y;EL#|oBk#y2IyoUtx%25wVnd+24rQ0m@{gX%(Q<Zv~z0vJ)9095DDpHCJ7~|+-
z*G3(?hh2r+NM(L%bZD(!rBgJUJLaFtH;5sWLu6lm8ahbc&o3tz3p6HX34>$72qa=g
z!Kfy;eM7y?)9SL<+Z&y5iNN(sN(=I}f24#5`h*^g^t>a_6l@p04wH`;OhP9}{<K!3
zmk#kkfRNt|prFn09)QCDuMyug^Nin968w68N8zWZnOh1@Y}s3Ji=iL46-x2rXp{lG
zomh>;@na0&?M*DPPM?9&$-3!vhNV<7C~dMeH#=QVm{I7~x&ikcrH}Vro1Vr=Le=Rd
z^1}WId8UvTU!*dpiM6QD1SW7FfDQE68}RzOL7$ZjUPB?s+8SsDkM}8xN7?FrVE+j~
z3lO#q)Vlx!04FI_ndM=D4}tS%fKvdc0X_ma18^4L9Kgq9>71G3VM-2?9dk~jUb3Pj
z6J6@tQnHdm{bYFV{0RY&y9Cfn!7RonfPRk@%(G5=NH=CF9%qGg&2xxvP$ORuu6zg`
z>kE`G24|Lv73rbG{z>N!NBn@Z_W?ctI7tpxm>zw2w|DK~^Pv6-g`l#exs^7V$AN|E
z_yUQmTp;<D@<$lLSN;w8`pOoXI5jK`UCSRptDkJDs@m{#&A$QW2*4->sJR*j|7TQC
z&7Y&fV=%k`aEl?ij}=LNqV#{5zUIenifD0iYvV}kQe{%8_)w4UHQ^M}GP0Umr<pzY
z1G0bVqU6y06)+R3*8ot^8D=eBO_a-~7#}7|QoAfk6521#WXrO|^rO^3P_a%Bnm5xI
z&c+4|8wex1H$yKPe4f0sEJgPzFrmWu9{?A~^<`yZITh0OO<Df6B;minrC*rBp#`Ol
zZo5rz@U*<SwOJi^18*CjSOHD!D%CTqu@cnj6ZD}A9h|V%>Eg#f-x^x$UA87i_$X)w
zvsx?$i$|F}iV`62PYt|EVL}EF%25lHj!5gC5XVw7qt8>fN`Y38i|ee4(1wQHY9=4g
zvNlYo@vowzpu!{2Q=W(SE4?bhTL?^tTKfy2t^s^WVLm+xCG;Wbv<p}Tt~3;Y0|xND
zRm985%g(Iq_dxe5g?owz&cSq0@$(ZFSCem?@f{G;!!~S?YjZZ^Ux7yG>WhMySb%Vg
z&<S%wP<QviyVho>p|(aUOXcn>>?@3oGLyhUXjgs(rbCT$9jLDXc2fw-+}Qbq(`9SK
z1`xh?8OHBpYq;g~Ae9ObO|Gx67iUtkuy5gpf3fHYnc>PtV#2$u=oER;m5)9o=Un~E
zVY!2%CL7)mR5sf%?G9S_Hu~itG{6@j7C0U;99Til<!-?@VF)J%hAkSDhVCn;8$+vO
zXb7B1hTR4<i+t-Y$!ug%bRcTd2nPgxluA@Lr9h5x467SqL)<zs`LsE)Z)5Xy_J8R*
Bu%!S1

diff --git a/tests/unit/storage/test_openwebui.py b/tests/unit/storage/test_openwebui.py
index cb84050..4055bbf 100644
--- a/tests/unit/storage/test_openwebui.py
+++ b/tests/unit/storage/test_openwebui.py
@@ -31,7 +31,7 @@ async def test_get_knowledge_id_returns_existing(
     assert knowledge_id == "kb-123"
     urls = [request["url"] for request in httpx_stub.requests]
     assert "http://storage.local/api/v1/knowledge/list" in urls
-    await storage.client.aclose()
+    await storage.http_client.client.aclose()
 
 
 @pytest.mark.asyncio
@@ -54,7 +54,7 @@ async def test_get_knowledge_id_creates_when_missing(
         url.startswith("http://storage.local/api/v1/knowledge/") and url.endswith("/create")
         for url in urls
     )
-    await storage.client.aclose()
+    await storage.http_client.client.aclose()
 
 
 @pytest.mark.asyncio
@@ -80,7 +80,7 @@ async def test_store_uploads_and_attaches_document(
     _, knowledge = knowledge_entry
     assert len(knowledge.get("files", [])) == 1
     assert knowledge["files"][0]["id"] == file_id
-    await storage.client.aclose()
+    await storage.http_client.client.aclose()
 
 
 @pytest.mark.asyncio
@@ -105,7 +105,7 @@ async def test_store_batch_handles_multiple_documents(
     assert knowledge_entry is not None
     _, knowledge = knowledge_entry
     assert {meta["id"] for meta in knowledge.get("files", [])} == set(file_ids)
-    await storage.client.aclose()
+    await storage.http_client.client.aclose()
 
 
 @pytest.mark.asyncio
@@ -133,4 +133,4 @@ async def test_delete_removes_file(
     knowledge = openwebui_service.get_knowledge("kb-55")
     assert knowledge is not None
     assert knowledge.get("files", []) == []
-    await storage.client.aclose()
+    await storage.http_client.client.aclose()
diff --git a/tests/unit/storage/test_r2r_helpers.py b/tests/unit/storage/test_r2r_helpers.py
index 015986c..6ef2af7 100644
--- a/tests/unit/storage/test_r2r_helpers.py
+++ b/tests/unit/storage/test_r2r_helpers.py
@@ -207,7 +207,7 @@ def r2r_client_stub(
     mock_async_client = MockAsyncClient(r2r_service)
     monkeypatch.setattr(
         "ingest_pipeline.storage.r2r.storage.AsyncClient",
-        lambda: mock_async_client,
+        lambda **kwargs: mock_async_client,
     )
 
     client = DummyClient(r2r_service)
diff --git a/tests/unit/tui/__pycache__/test_dashboard_screen.cpython-312-pytest-8.4.2.pyc b/tests/unit/tui/__pycache__/test_dashboard_screen.cpython-312-pytest-8.4.2.pyc
index 851398c487fb6dbaeb26399d1e23c11fba1fd08e..0e464ef1599004631705e8de31b9884825497c0b 100644
GIT binary patch
delta 7072
zcmcIoYj7Lab>0gs7LUb)1V8|MgP=$Xe93xIFG{vv)~lvyQL-$kDgt3a2^2ukcbAq(
zlZD*KmXo>@*|$mL)M=Y^rU@fkZK~-^>drWp>`rHrrlmwXV%Ab)JBeG5e^f51v90M;
zJ?Ab+f~4fOKe7XS_w2d%+;bo2oO|wmF#7Ya68BGCE{6cmMgPx^_k~|@hsawmG_~i=
z8C%vKvu7PK2N4uOF=gbK45gTHW?eBC=UFoDtS9E-w3I2ymc~jsZOwSIzL<~Gwv0bp
z7AxblJrl?VV?j<kGNEjFtUOy0tH@TyDmhQiRAsAU)kH|y^Hc(5&P+|VHdadnldwZj
zTxSHuopM|-<8TEb7Uo<Ja7!+j3cNbbD+Qi6RXy7>!nr=+`codoR1S@2>*`Z--%dli
z2+cy@ZuY3pm#9+8&WINZHL*tCQ2;s$7IojGR4bt~Vr(g|Er;5QMQWn=R8!E>Ri#uG
zX=xrZMQc7nol&C8iT?hameA6<ezhxV(p~!xb#ISv-MM}1o?Tr#bXzygX}M%B15K?v
zHErMk&9EPnW3pMdZObJGv#EZKHJRG;Q19;1ax`%)^+=*0kS2@fD-;%$Ol<@1H-(fC
zBZ?3+9S{@}Gb^T)sF*vUMsX-2%+#XDiUmqZaVip&R>h@Qp|mM(#RjE)$R73Rfg*j6
zgTk4i4zHe}!o4{fR*g}Gv&OK(>3%ImdlSi2cu-9#@EX=qs;0K<;?Z0#qr1~;Jl&tx
z(uquZIHj<^wl;dlNY|J!Ms!h4WqMTt17)w6A7v&>d9b}`5Jh8P?Uqmo4Pi<G_;=y6
zr-jd_L?HjbBogSeDG-1c8bk;I@J_?Dg8j3lJl}lpKHHC_w0I(uiNkheQc1pL71%))
zLN!1VhgST+vJ<ZMo5GMl@2wKr>jB>NlZkXDaWuouNpi65-eX`FrC`1iM5fRso))H1
zTe9FDNb~1DYR60zmqfQ7O(ajG`V|%B!Z2%O$~c5V#c<@_+W86`Ej6V1tRo;w>)ET;
z=J@?*XHRBwY6_QbIDDUuXItPh&Mj!ym`RstN*kp8?0H+&PMARpG`Qo>q*d+k*4cg7
z)!&;tGQYB*Xp1q}BV!_M#I9WkE$o-J3MclYi(R??RMf#l`;xqFjmMQ-G9K4G@pzG6
z#^V&1oYo@LAv7UG5x51_BgIX@ixh$%{wlJb5q=>)_?|yBA%=b>cD*ZZdsp22uK36e
zv6*r)Y@CEY*z`|YO7gux%=ga}_$T*GGf*O@EI>(|vI1q}REc5-&lHtX#Q~*7@hUQu
zlHyaGP+Ao~1X%RoGQ|z0eaI6H=-&Ce(W4DE9;IzC0^M0`<a8Ob9PvcKKvQ?v0b9M#
zHe*KA2lW(Z%r2Y0`Y>IO%|+ZIT|AK*Qt1Y)-#F7KYBtPJF7hK@tAgEvJsJkd{>$7%
z8rc$Yr3nn|koe^42cb49ay`1Jq?4L%>!rEuoQ7gYMrF8ZtisYtTG<ZEKt1=rDB;7K
z=k(YX_jb6EWvxMW*Ww`$Fpu<j1Wg(Q`0y8Yj&?8{<pP%^Z*V2Ns!o8@!lcLdwftA|
z<F*<Y_zmf?M&6ByPf<66o6!brT;zP*p4bU%m~^n`0l7of+}EMF<+0DKHTiYW(Uctk
zA{<xzIgdkKQHgE=F5gRI;n7C8@6Z)UH6yelv?Dx#upA)jpg0q{3Sl+E8icI~i+y0*
zy`2C@MG?aASJwhOBTRZ5C&b3dk|h)3l1cZn331sZ_lYTyW$e`wcZGHAa!Wb;zJ1VP
z0~s&|GS$VJ91VWW3h(?;$b~|TWnGR<U>|?vsLhMIMI9VSQDc~HXh<>Y7wnAty>5@k
zlbM97#^VJmJ8d{D&TKf?4K?W}Qw4WukMk2K9^V9&D*8Gs?hTvkE7q&F&<$t#WT^H=
zd3d~T^+b8cWVqEiZ53Va+h)n`Fhb$|&X$ba?Armo(MJ$4(shjydf>&TRV2XvRj#h)
z(b)zeh@b290JNC%2^MmO$!@mJ+11P~<9DHUtl&!a85wn<&<~xhGFO*Coku}e>mq4+
zMmnBW7Rv8*Me^M!YRCfxE?5*vv5H$1TF;n7<H$fi;2qs@s2UBAgfYl+>(kA^fMzLZ
zG3@41d|P3<N4Nydpe%;wVLPu@wLCon5^3aT5pY@Nn(^QhwJ$VVZn1~3<(CjJtkOOJ
z-BmDzWC~95IIRCc;PT`DA;Ti}Vp9YRSZaqLY!W^@BiuGwEsiNKvG{LELO0n@ZVSW`
z0s06@%+h;F5BU`NpCB0VeJ>jILG-7y_Y3Tn=Y(FOn9n#Nd`m_G_MC8v#H1b}YSmpm
zNt#Oa?}sF5^S}T_Z-;|Q<xE!Fx@SM`Cm6zGP#7Md84PYslF`tZCAbvC*J8^L%<FvC
z@DH*lJT(x8&Uv&3-n~he2L{#S1+^44%nP9`TGBucv%Mwj^QW*5M_CkZxN%q)?$KOm
z8O7!U2u}bM?}my@g#GZJ@&SAX!Nk=tAvW9=O_rKZZN$=MtTeVt3OL-E2S@Q`3?pyY
znXh!2OVA3zLl8y;wzu?q8_5V6HEHsUz=%n~+mP^z=K>~+@Qj)@mqCGyc_#RbiX&p5
zhg~i8vGIVFZEA<oE3)r;E7^Z|EyOolGtllcoBPV}u2Ej1&5mv6LNjU|vG$ciZ5=`M
zv1ff-WQ?=?>8s+r4}BpSk0*l{F7)jrmF%vsisk$ck(Ozd>}H^v4fx%_M(SmMqzoe$
zf3&$Sm$K5JkKJ7!V*l;0Sfr|>?2A<WxU5Lk8)g4@Rb2szUGw|cu|U}(mEQ_{k;=~l
zE<T|~sh=n{g;{n79fet*3VzWnuLL7(e;~l_1ig#YHiv$TYS*&9z+#oJmH*aMeo*lq
zoP}>zs?r(QaC(k)Rz)SSe1Sg0PE^%N&mwu2y;#*HeGSPM*@soN2A46pdY>1a7S79;
zpwP_&Lo4W?uw3;Yw}tpI&XZ={c5wUV$98Srznuq1-LbcOdsqD6_ALi?8Q!k4)itY#
z%=&8np_^wPx<@sxe(}Q9PcK`*h-*UwDTShP-JBR0&`DgEPUh%|6xA&nT!m8fJP!BU
zY_N8aRIrb0*E!w*1|Bl%>#RL|)_=<@v~`Y)<-c|{Oxmg^OUov`flI#$x0>@?YI|zP
zl{&KTLFr1wjC8}29-H}1JLxe=Z#p`GeoK;p|5hpKv50SZyV~Jp!bG5A!a|U?Nj;U;
z2{-8}bxwG!NC#}dPlEc{rw}K|)KOp+g?O_`v9s6gofU9*hP?e{!tc)3n2m>aJA`%*
z`*=xYF4gH{!G_KLxmYwW)v4S~ABFxQ@69Du+5;q{cyke-=R6pv=ywo!_G4W3jKI%x
z&6&8*UTdh6#-N?r#@=tJ2o>crjSEwmN(@<xugS<f#P&7Tm;McsJi*}k42?mCQO$)g
zKcT+|Fqgt0=S%E*V~zZ`NY17tMFPqqfnN4#(-Qed_Y*k2NT82hZK@6Z{hR<$Nj&=S
zA(xgeO^{~1wm~Apk4Q@<olR@Hl<VzPAvxz+7w#(DM8fbz;9_(Qd7XV2U7N@6NIXlX
zCy?q#$N@x6AK|bmu5#2y--bdr!)Ffq4ss_E=I1QKL7v*+9p*6PL#^T5(LVT~aOBA1
z^m{8x8+l9~$=O7P{v2QLd1hY08ien|U&S8&KM71Bv2j`)<Ht^XDnR)O0<E|3ZrSI}
zYf8S1<Qar#5T0cZwbZYC4oSYSg#IDWGv8Ez)Ju*IrZY;>rIPBv{u%p5OEaVykRcsj
z1@A@f!#_>UUVXnfLn@m|A?GDC6u*1&Oa-$f!^ECM)=7YZP0qT++17gb238Is@WjV3
z{ipCfgc6uKfIZ;*DBIRnpMMX@-$%fm0c$#iG}nsx>s(q)Pvh&t%!aE&_yyKJjZlw(
ztR(zrAH4j)f|IH5LO!!cAdp649&>5DEo@$|q1*9i#G*LSo@a9ud0w4sUY&D9W><aw
zno*bH9<`c;5!Z-yR?t1-R==ZoloIyCKno-@m``*E?Iv2r9$Hq5qzI>R34gh}+|G_K
zTMGYLmwToMrSxTyy}e?G)pd%DT1VZNA}bvxlM-a@D{d3#jN;IJ6_?K`mYp-58rog6
z?=Xb&|9uFRg&_<HYlL&+^Er+&j*aYiN4-~ke$6TKA>kx>)qIjfE4t{{*|$3?rJuk`
z(r>WWJ2sU3DUv@0_{fZ4W#XE8Pe)XBJk_vtU<iot#xOfqUAauv5>!)9rnTda(WO|o
zDyl{uqx4@u49w#t?B~xA-beU=J+<b6{4iek+Lo_axk{ISf*V-W$9>l@B=iz)5%e#B
z(k%lC_-IQ161g(M_Yly{DF$@<D#AsCze30Y=x_y_85aEkaxWmf0s!A|E3Jhi*)U!V
z%b+Bk$!YXQtbJ`jdL0}89oxOOW;srSeuVHEHj^J37>dKaIYqVAss}h2FN+=sooww2
zc?xQN4S%)Cd}(}bJ;~n)R-9jX{)v}5*i)zX-0+s2OP;TLp_jFset1$2T$k&v%5~#n
z$9QBlAkvZ56LJTqJFbg!zjwrr=QbFOi8=CZkd*5T_BGzi94&KUcTpeEnjK#MF)3x;
z8zR>0;!^m%!~Q8!!SWlLEboX*Z&k7j8yfOG9&(wGeGf>NO=hGm{(bArm&?h%mD1&k
z7ND<KWZ+*ZA^SSSE2Z6Gc)7NcK*hBVg7iA6$7#LxAY>lS3Bd~Vgw+Oo<CBZXqor|9
z@W5e%<%+hz2e)|dAbk2vF|E@}e!$LluH1}UtxJ$LrTdRjJftW_WnCH=!jI^>ZD2@A
z^lRxPPXTmUOP$gN6Pb3%ttf^Oy@uWG4B4_dC6!UBjos;7M(nJ4<1*r4v5l>ey`9}y
zC-dt&&nDdL;>L)Co2$2>WPVUfXVmruX&f!Vf#8QsBVF8!6yC;kF`J+#bZbH#>QAO~
z^bM@wr_-EWqkSy+ih9S^2_qcLq&86r0v-GW^&bIlne&8@n?mH@1mTQuU1<K5;JPVP
z-4rT+BdohAbn)M|UkZD#3VUw~tKK)4+!TLjTC$Ut^N&vpP<$GyApTDTfa&#q5;=Ex
zT7Y7@-A3BZZ9Ol(uxnZX@>W1F+0IrzU3s1OuM+=%njR*kY04~^%5Lr9^mMl=LLBE?
jrUfXbb`v|1rb8fje(Rr$FWsjPFNyLlJ~08s1O5L1$De4N

delta 5938
zcmcgweQ;FO6@T}=-M8PHO?I={&FAI|*pP%IAOVCx5)h#piHTpUxGs4cSlEwv-$qDG
zj3^aw=m1`)!W1j`N82=Z90y11bgBl$8K><?z!BzEM%#|lTBjpOEY`nz&V9RK6DZR^
zI(?J;-g)QTd(Qnh_ndS0lV{1FN1eZOIIIFZ&%E*bZI726cKXN@hvzqriE(qttO$w}
zw<N3~D-nP;#BB+C$j)hF+>vmGoSc^9c?nm@#c5MKKT!}W;IujJPIy9|L}93qe_P_-
zL{X@S2%@lFP^^0d#Wo?LZ9xe6IL{6|N3>`{TA5+{Iok>Byr@+X{lK1(GP2^RdHYhG
z&c*G^SbK>(Qlz-{7$!1;P#M>g4|)nveMUpM;#1sv4511x^?<bSIxB&jS#kRnZ;qA9
zAu(9YE)g%Q7yF6GUKAV0`f|sXnJu}3^Ls&v3L&BhAyF|a1co6g7Da@&L9r?lyp4)Y
zF~D0^?1~ZICdHx1@HP*bf=;cVC!L~^t<gIpNkH0@9^BHGnHV=|0F(rF(Y!OF*~5LQ
zcs$ydj-`^SW{Ahsv}V{59a1%GIPzE|7LRO+M>X@7NZ*cVQc*Q$Oby49v2-jFj}1qa
zprjepXuMyu<*1<^FrcEvK!9mdH~WcY9?4^;EQ`e}0=sH?tR)X*K?5y>mu666eQC|y
zPg4oBOWnX6C)5isl>h{&50KRvib)-tw7c1x)*@2KKC%uh8Yf*rLR}!H<+Gb>?yb>u
zI1-QNPLDleTR{A5zwLfsB{YYwXlqtic9*e~iT1kUQq*S$cv85K=RP>Lf9#C8oE8Iv
zU3PofL-tk6xek#}R+GS7P~?NwOxeZ4Jq_r?*K9bRjDWpk50DD>Ibbm(j=E~pG(LME
zz|kyy@st|HSqzu*nLq5XtgZsd6$`-Mgzxy+{&fZS^C{5)iy_k@puhLvHa^%nv#}eJ
z{i)4-pu_BWbM=@^qv=7K)C^szWE6(o1f7P9aUUMcxK4+@-}QklsZ@M(rU_jH?Xt~v
z8?&2lhCN*XZ77aU*ILjKQKOkwfsp_j9CzpzX)~&`u$88owG_`Utw6vD(prQdLOsGl
z1YCUX3)F!Wf)oDL0KgvMipc7mWioH%V7uLZ*6$p&nm`7Q2*-+j;j9%E!pig7$O5)G
zuVR^`8P&moDAjFas0&Jb2l*T{OE}yYkEm)moN?tRb>n{aR$giSd}yxXzQHDZYIf{5
zO__b4+Wi-N6&L&s7XtOuCWFKItt4Bll<%<@+v@Ykbyc?BRp-U!rws^=0A1kxtKiL=
z^P5Q}d&^bUhG#)DE2+N0L^PS^(#)7L-epwb#7Bocn_#@L$Fl3)$hnJ|C%>zXn_mlh
z#`QUBmaIB;jy`rEzut+_lWsuR2!KPWzfOZKt05dy=IW>}s2W>7OUHGt!MC5bK%;R3
z@BY12P1B5zaOcq^V2q1gNPDrNOuJF(JqWl)oU6Arpr-~cbTP7*0BoeUAjuu89jV(9
zx)AOL&>Wfl?TbQ`2*aYU1}={{YxIq7#ij`J*h;sr;Wo07d@B%R)g@WDlXTC}caa`)
z75SGDbT4g12V8|mVQ+3Qm-Y$$1OmDp0=hvD==+3SBxLLnf=12J(?_GxWN%bWw+{?J
znEAo|xaP27Z8#E~h-M0_yis-+W&KkhyB=|~ZVJtZy|Yv{hI!}?huhd8PdUV%S3T)k
zZbH;-1B2?ejB*-Ad$Zj1_QG1y!IFh5#v&+_5xCpp8P+#ZzP9u^E8mau2M|I4xy$<y
zG7)eiui$C^ZjbP-C>qPJnu)PNUr3bq5rFJt!_e|Hp6DhkTjgEkAn6(L2w^9@<?IFT
z{t_{5%k~%%N5t)@KJ&1n-bUAK7I^riw}!prHJ2*FD|r(bP~jPs(wM0DGa^k8_Tu7l
zmMW?sZgvo`kiA;8h!kN>;diAmN%1FJxQv=cOxsIP%F2CCqEl;p9hS0eOIEqm!(Q_F
z+1V9!q>N3Lls)IS+h)Yu=dlwd?&tg#SCS~+^c+5WqSeB}et#iGN&e)tsKcJ@xW8qN
zv9J9(#@MFf>#PBfn=8pt#)t7=n7dS5PU_i-6>e5l;+bQ(r{tR9c}`k5M|~+yv3w5G
z&5kX#*so*0d#jbLEcM-F-uCik?Df)uIYanM>Hl#EBc)ZO=|8N6TK<0=$gzsgA>EAz
zR5<}oLWkHt13@{CWRlfZR>~<P2iP5zUGgp@A7{raD|GG%J6(Bq0iJiri%-EzlLm%b
z=pGiVdcMW4Ct*B|n)$wU?e}hI?_I~ErDnZr)4Hzked{{z*`Nms^icW``+L<AVrCW9
zr*G42iBuAby@5!&ZyPUJv^>mJP_2d&deKVJt|mnW1~d}Z<ee$HBT6-68p~0-8x=mo
zmedRqANys^a_cxSZi9bSWB;hx+cfPGobxW2i!S5`&ga)p<=4OR@cD+dQw?j+<*&O?
zP<g(fVXC0vmE`%x^;3=O&lTK$a$jw|^gw4(ua~^%Cq1q5d&LscWi`Em^gbayE9CdZ
zl}NYQfPdOTdR7@uTe}+J<J<}Yf^(|~&>stOuiNyoOnNQ$k4+||o#tLIa|DaFD=@rS
z$-thI4D6Ze9@4@w0=2wxj|?@w{^f+qUWQ6v|H@NL@MVH~fdx3$W0K-hY``(|L}GzN
zlFtqVtF9G3_p@II+x5byWQ<}?hKf7Yr_x)23>vTH7K#;+Ub#JsBE6c`GYhX|a}!JH
z+DtK$Dedr%F_T_?1l?6EkY?9LpZfgs&ifWk`4;gKY2MrtsiYDIz)QW{+=I+^=2}?o
z`7x3W2)s_B9YA7fvVnKR;)Zf3(DR^P8u6?@?7z`)d3AIYdu>3-7CL3uwA}&xS%ntu
zVtMs7&SN+0wCTD|ce8`_70X_l)#*$02a4+oS14mVmWZV_Io02<M)mq`Ch18hKd6t8
zT3i+=p|BF9ClOvpz|^T?whF*QeXP5&mAuUMH!d5iMllvwv<Kl{g!=&Cih$iUDF%fk
z*D;AARK$y^p!J4nydCAU3n=<7@@|;gCj`j1bOPiD;9p(G+THHeH>;nrb=8vAcOz%E
z?zk%0jn>NudKG}0*omN*U0hUN$b%OTW=R|X2C!idd#%CU7TO9lJnPobN8!a?2`+hQ
zpmT1Lnrq8oEUx5S4C#B&;x!g&s)L#c3b)3a7H-m<!p*=wYbwHOt%^I&!)W;tG^x8`
z?x`tfe`+f9%$$?AvFR2BUWx^Hf9@A^{U58SVcwgqZn1Qn!ag`zx($JEa}24uHP&fl
zBK#JK?FjsWbebJ+@r!58Cx6pYFF8kyiro*gQF%n(UW!?(#H=_*ZK5z@9<faj5TVpQ
zVpr3OlXc%(!R*TxKw-j$fP^HCZ?`?$P{})H7?z=fgT1sQ2vvxWeZIt4u#1e^K!;Ir
z>9&-7Hr{&m<ndOMXvnc!^gp&+tlJ$DT7^S~113P}z&9M<W*=45Hh;8BdO+AoekJWB
zL0=br0%khws?J_*)Ucj$@SxH+5XRUKSKeydi{zUCUrOxE%Ie<MplW@*cEP|95P?+z
zq!wpcKxA0WK^5*~5t>$a#?srYqYJRzEkQMC9fh;~A?kb@VGqK7cE_rwu`f+P598gh
zp}A%8l3*S`RusA1ZTap}JZ744ATp>%=|L2k5e^|7MtBZ^htC&~Is%}<Z7Vwx_|3?a
z$-g}B(w|}j<3KDPOQq=v{E%pBr)FC-FcgL>W|XFz=+9Bp%P8aQ{uE6_(zoP(w9=o=
zi1l7e=`VnzIsq_ZU3(yQ?QUza{SgEoV2i8b$+z38$+inN=e|exFFj*u-naC;t#ry(
z3gnrxCP1Xin$FppIo*8TfPc`6zt2J|Tj@2rtmztU%e2)wfS(weS#r%+){LnI`<Aj$
zdzA%sEr7qX>}dN!BM_I0*oW=4W8L$~Bq7~qc~X>+HhQ}ArAa^Ow#k#l3xPgmv;qH=
zi*!2;r}Dd&!N-)1fMCi=kj|I8YfMu`q`TNY<uf5&VFo_904A2<f`Oql+yNW!<TcVJ
zUL(!iwStCaJfP7@XsTbqj7VV&2v)(5cH#a(_-!W|4pWRj@XH+pyL2q6QpTR_SX_ec
zpvk%g&6bYtN)JZjjZkJ$1N*w8h8UTra}kl*T0j#^ch*D6cA~RVwxAI!`$K2dm<>q?
z@cQMLU*R-EB0_g)rieO}?2D!7I7%^U=lCe@?VKNSzBjK-q?EyUw2giRQVcXI_PQhy
zLM{qbe-+?|ou?fag_19X<rjr6{x`PvGhy9DVaZjwka#W&0Mkt#Qg!ITX#rl-jWTIC
z)Oo~kc*C>+<fQ^ZH193hU2>jyrikYov6GPbS0q6!yu``rjbatC9$7do!0XCJVj=Rh
Z5BeSHJZ?C8LlvOIMS@(#Wu$mS{WqjiQ*HnN

diff --git a/tests/unit/utils/__pycache__/test_vectorizer.cpython-312-pytest-8.4.2.pyc b/tests/unit/utils/__pycache__/test_vectorizer.cpython-312-pytest-8.4.2.pyc
index 1c566abcd49c2213e67357ac4fcd18a7da851fcf..d3d034ca051d67db74670fd2ae0e5188b2ae04d6 100644
GIT binary patch
delta 126
zcmcZ-dM=drG%qg~0}#lBpUs%Dk$0*HYY``qyLqEX86)G(%^G6-j6Q)EtOGBw1YY1a
q2Qn^l2VQ3Zp{p<v2=_9W3t?XZvaO-YAR=%zlN)(NH%}3F5C#B;;w)wW

delta 132
zcmX>XdL@+iG%qg~0}x!CcqU`wM&79+{8ha9IXQ{BiTX+Dsk*two0p4}F*07=EGNd#
z=;5`){sN2F1#a^l_7}OmuCsv9Rj2@jcNxrsurILy)kB!bBv8rZMjp}4ec}$n07?2U
A$N&HU

diff --git a/tests/unit/utils/test_vectorizer.py b/tests/unit/utils/test_vectorizer.py
index 5247e64..10f4543 100644
--- a/tests/unit/utils/test_vectorizer.py
+++ b/tests/unit/utils/test_vectorizer.py
@@ -48,7 +48,7 @@ async def test_vectorizer_storage_config_uses_defaults(
         vector = await vectorizer.vectorize("repo content")
 
     assert len(vector) == 1024
-    assert httpx_stub.requests[0]["json_body"]["model"] == "ollama/bge-m3"
+    assert httpx_stub.requests[0]["json_body"]["model"] == "ollama/bge-m3:latest"
     assert httpx_stub.requests[0]["url"] == "http://llm.lab/v1/embeddings"
 
 
diff --git a/uv.lock b/uv.lock
index 5a3c29a..61adac4 100644
--- a/uv.lock
+++ b/uv.lock
@@ -236,18 +236,6 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/25/2f/efa9d26dbb612b774990741fd8f13c7cf4cfd085b870e4a5af5c82eaf5f1/authlib-1.6.3-py2.py3-none-any.whl", hash = "sha256:7ea0f082edd95a03b7b72edac65ec7f8f68d703017d7e37573aee4fc603f2a48", size = 240105, upload-time = "2025-08-26T12:13:23.889Z" },
 ]
 
-[[package]]
-name = "basedpyright"
-version = "1.31.4"
-source = { registry = "https://pypi.org/simple" }
-dependencies = [
-    { name = "nodejs-wheel-binaries" },
-]
-sdist = { url = "https://files.pythonhosted.org/packages/0b/53/570b03ec0445a9b2cc69788482c1d12902a9b88a9b159e449c4c537c4e3a/basedpyright-1.31.4.tar.gz", hash = "sha256:2450deb16530f7c88c1a7da04530a079f9b0b18ae1c71cb6f812825b3b82d0b1", size = 22494467, upload-time = "2025-09-03T13:05:55.817Z" }
-wheels = [
-    { url = "https://files.pythonhosted.org/packages/e5/40/d1047a5addcade9291685d06ef42a63c1347517018bafd82747af9da0294/basedpyright-1.31.4-py3-none-any.whl", hash = "sha256:055e4a38024bd653be12d6216c1cfdbee49a1096d342b4d5f5b4560f7714b6fc", size = 11731440, upload-time = "2025-09-03T13:05:52.308Z" },
-]
-
 [[package]]
 name = "cachetools"
 version = "6.2.0"
@@ -989,8 +977,8 @@ dependencies = [
 
 [package.dev-dependencies]
 dev = [
-    { name = "basedpyright" },
     { name = "mypy" },
+    { name = "pylance" },
     { name = "pyrefly" },
     { name = "pytest" },
     { name = "pytest-asyncio" },
@@ -1019,8 +1007,8 @@ requires-dist = [
 
 [package.metadata.requires-dev]
 dev = [
-    { name = "basedpyright", specifier = ">=1.31.4" },
     { name = "mypy", specifier = ">=1.7.0" },
+    { name = "pylance", specifier = ">=0.36.0" },
     { name = "pyrefly", specifier = ">=0.33.0" },
     { name = "pytest", specifier = ">=7.4.0" },
     { name = "pytest-asyncio", specifier = ">=0.21.0" },
@@ -1432,19 +1420,84 @@ wheels = [
 ]
 
 [[package]]
-name = "nodejs-wheel-binaries"
-version = "22.19.0"
+name = "numpy"
+version = "2.3.3"
 source = { registry = "https://pypi.org/simple" }
-sdist = { url = "https://files.pythonhosted.org/packages/bd/ca/6033f80b7aebc23cb31ed8b09608b6308c5273c3522aedd043e8a0644d83/nodejs_wheel_binaries-22.19.0.tar.gz", hash = "sha256:e69b97ef443d36a72602f7ed356c6a36323873230f894799f4270a853932fdb3", size = 8060, upload-time = "2025-09-12T10:33:46.935Z" }
+sdist = { url = "https://files.pythonhosted.org/packages/d0/19/95b3d357407220ed24c139018d2518fab0a61a948e68286a25f1a4d049ff/numpy-2.3.3.tar.gz", hash = "sha256:ddc7c39727ba62b80dfdbedf400d1c10ddfa8eefbd7ec8dcb118be8b56d31029", size = 20576648, upload-time = "2025-09-09T16:54:12.543Z" }
 wheels = [
-    { url = "https://files.pythonhosted.org/packages/93/a2/0d055fd1d8c9a7a971c4db10cf42f3bba57c964beb6cf383ca053f2cdd20/nodejs_wheel_binaries-22.19.0-py2.py3-none-macosx_11_0_arm64.whl", hash = "sha256:43eca1526455a1fb4cb777095198f7ebe5111a4444749c87f5c2b84645aaa72a", size = 50902454, upload-time = "2025-09-12T10:33:18.3Z" },
-    { url = "https://files.pythonhosted.org/packages/b5/f5/446f7b3c5be1d2f5145ffa3c9aac3496e06cdf0f436adeb21a1f95dd79a7/nodejs_wheel_binaries-22.19.0-py2.py3-none-macosx_11_0_x86_64.whl", hash = "sha256:feb06709e1320790d34babdf71d841ec7f28e4c73217d733e7f5023060a86bfc", size = 51837860, upload-time = "2025-09-12T10:33:21.599Z" },
-    { url = "https://files.pythonhosted.org/packages/1e/4e/d0a036f04fd0f5dc3ae505430657044b8d9853c33be6b2d122bb171aaca3/nodejs_wheel_binaries-22.19.0-py2.py3-none-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:db9f5777292491430457c99228d3a267decf12a09d31246f0692391e3513285e", size = 57841528, upload-time = "2025-09-12T10:33:25.433Z" },
-    { url = "https://files.pythonhosted.org/packages/e2/11/4811d27819f229cc129925c170db20c12d4f01ad366a0066f06d6eb833cf/nodejs_wheel_binaries-22.19.0-py2.py3-none-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:1392896f1a05a88a8a89b26e182d90fdf3020b4598a047807b91b65731e24c00", size = 58368815, upload-time = "2025-09-12T10:33:29.083Z" },
-    { url = "https://files.pythonhosted.org/packages/6e/94/df41416856b980e38a7ff280cfb59f142a77955ccdbec7cc4260d8ab2e78/nodejs_wheel_binaries-22.19.0-py2.py3-none-musllinux_1_2_aarch64.whl", hash = "sha256:9164c876644f949cad665e3ada00f75023e18f381e78a1d7b60ccbbfb4086e73", size = 59690937, upload-time = "2025-09-12T10:33:32.771Z" },
-    { url = "https://files.pythonhosted.org/packages/d1/39/8d0d5f84b7616bdc4eca725f5d64a1cfcac3d90cf3f30cae17d12f8e987f/nodejs_wheel_binaries-22.19.0-py2.py3-none-musllinux_1_2_x86_64.whl", hash = "sha256:6b4b75166134010bc9cfebd30dc57047796a27049fef3fc22316216d76bc0af7", size = 60751996, upload-time = "2025-09-12T10:33:36.962Z" },
-    { url = "https://files.pythonhosted.org/packages/41/93/2d66b5b60055dd1de6e37e35bef563c15e4cafa5cfe3a6990e0ab358e515/nodejs_wheel_binaries-22.19.0-py2.py3-none-win_amd64.whl", hash = "sha256:3f271f5abfc71b052a6b074225eca8c1223a0f7216863439b86feaca814f6e5a", size = 40026140, upload-time = "2025-09-12T10:33:40.33Z" },
-    { url = "https://files.pythonhosted.org/packages/a3/46/c9cf7ff7e3c71f07ca8331c939afd09b6e59fc85a2944ea9411e8b29ce50/nodejs_wheel_binaries-22.19.0-py2.py3-none-win_arm64.whl", hash = "sha256:666a355fe0c9bde44a9221cd543599b029045643c8196b8eedb44f28dc192e06", size = 38804500, upload-time = "2025-09-12T10:33:43.302Z" },
+    { url = "https://files.pythonhosted.org/packages/7a/45/e80d203ef6b267aa29b22714fb558930b27960a0c5ce3c19c999232bb3eb/numpy-2.3.3-cp311-cp311-macosx_10_9_x86_64.whl", hash = "sha256:0ffc4f5caba7dfcbe944ed674b7eef683c7e94874046454bb79ed7ee0236f59d", size = 21259253, upload-time = "2025-09-09T15:56:02.094Z" },
+    { url = "https://files.pythonhosted.org/packages/52/18/cf2c648fccf339e59302e00e5f2bc87725a3ce1992f30f3f78c9044d7c43/numpy-2.3.3-cp311-cp311-macosx_11_0_arm64.whl", hash = "sha256:e7e946c7170858a0295f79a60214424caac2ffdb0063d4d79cb681f9aa0aa569", size = 14450980, upload-time = "2025-09-09T15:56:05.926Z" },
+    { url = "https://files.pythonhosted.org/packages/93/fb/9af1082bec870188c42a1c239839915b74a5099c392389ff04215dcee812/numpy-2.3.3-cp311-cp311-macosx_14_0_arm64.whl", hash = "sha256:cd4260f64bc794c3390a63bf0728220dd1a68170c169088a1e0dfa2fde1be12f", size = 5379709, upload-time = "2025-09-09T15:56:07.95Z" },
+    { url = "https://files.pythonhosted.org/packages/75/0f/bfd7abca52bcbf9a4a65abc83fe18ef01ccdeb37bfb28bbd6ad613447c79/numpy-2.3.3-cp311-cp311-macosx_14_0_x86_64.whl", hash = "sha256:f0ddb4b96a87b6728df9362135e764eac3cfa674499943ebc44ce96c478ab125", size = 6913923, upload-time = "2025-09-09T15:56:09.443Z" },
+    { url = "https://files.pythonhosted.org/packages/79/55/d69adad255e87ab7afda1caf93ca997859092afeb697703e2f010f7c2e55/numpy-2.3.3-cp311-cp311-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:afd07d377f478344ec6ca2b8d4ca08ae8bd44706763d1efb56397de606393f48", size = 14589591, upload-time = "2025-09-09T15:56:11.234Z" },
+    { url = "https://files.pythonhosted.org/packages/10/a2/010b0e27ddeacab7839957d7a8f00e91206e0c2c47abbb5f35a2630e5387/numpy-2.3.3-cp311-cp311-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:bc92a5dedcc53857249ca51ef29f5e5f2f8c513e22cfb90faeb20343b8c6f7a6", size = 16938714, upload-time = "2025-09-09T15:56:14.637Z" },
+    { url = "https://files.pythonhosted.org/packages/1c/6b/12ce8ede632c7126eb2762b9e15e18e204b81725b81f35176eac14dc5b82/numpy-2.3.3-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:7af05ed4dc19f308e1d9fc759f36f21921eb7bbfc82843eeec6b2a2863a0aefa", size = 16370592, upload-time = "2025-09-09T15:56:17.285Z" },
+    { url = "https://files.pythonhosted.org/packages/b4/35/aba8568b2593067bb6a8fe4c52babb23b4c3b9c80e1b49dff03a09925e4a/numpy-2.3.3-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:433bf137e338677cebdd5beac0199ac84712ad9d630b74eceeb759eaa45ddf30", size = 18884474, upload-time = "2025-09-09T15:56:20.943Z" },
+    { url = "https://files.pythonhosted.org/packages/45/fa/7f43ba10c77575e8be7b0138d107e4f44ca4a1ef322cd16980ea3e8b8222/numpy-2.3.3-cp311-cp311-win32.whl", hash = "sha256:eb63d443d7b4ffd1e873f8155260d7f58e7e4b095961b01c91062935c2491e57", size = 6599794, upload-time = "2025-09-09T15:56:23.258Z" },
+    { url = "https://files.pythonhosted.org/packages/0a/a2/a4f78cb2241fe5664a22a10332f2be886dcdea8784c9f6a01c272da9b426/numpy-2.3.3-cp311-cp311-win_amd64.whl", hash = "sha256:ec9d249840f6a565f58d8f913bccac2444235025bbb13e9a4681783572ee3caa", size = 13088104, upload-time = "2025-09-09T15:56:25.476Z" },
+    { url = "https://files.pythonhosted.org/packages/79/64/e424e975adbd38282ebcd4891661965b78783de893b381cbc4832fb9beb2/numpy-2.3.3-cp311-cp311-win_arm64.whl", hash = "sha256:74c2a948d02f88c11a3c075d9733f1ae67d97c6bdb97f2bb542f980458b257e7", size = 10460772, upload-time = "2025-09-09T15:56:27.679Z" },
+    { url = "https://files.pythonhosted.org/packages/51/5d/bb7fc075b762c96329147799e1bcc9176ab07ca6375ea976c475482ad5b3/numpy-2.3.3-cp312-cp312-macosx_10_13_x86_64.whl", hash = "sha256:cfdd09f9c84a1a934cde1eec2267f0a43a7cd44b2cca4ff95b7c0d14d144b0bf", size = 20957014, upload-time = "2025-09-09T15:56:29.966Z" },
+    { url = "https://files.pythonhosted.org/packages/6b/0e/c6211bb92af26517acd52125a237a92afe9c3124c6a68d3b9f81b62a0568/numpy-2.3.3-cp312-cp312-macosx_11_0_arm64.whl", hash = "sha256:cb32e3cf0f762aee47ad1ddc6672988f7f27045b0783c887190545baba73aa25", size = 14185220, upload-time = "2025-09-09T15:56:32.175Z" },
+    { url = "https://files.pythonhosted.org/packages/22/f2/07bb754eb2ede9073f4054f7c0286b0d9d2e23982e090a80d478b26d35ca/numpy-2.3.3-cp312-cp312-macosx_14_0_arm64.whl", hash = "sha256:396b254daeb0a57b1fe0ecb5e3cff6fa79a380fa97c8f7781a6d08cd429418fe", size = 5113918, upload-time = "2025-09-09T15:56:34.175Z" },
+    { url = "https://files.pythonhosted.org/packages/81/0a/afa51697e9fb74642f231ea36aca80fa17c8fb89f7a82abd5174023c3960/numpy-2.3.3-cp312-cp312-macosx_14_0_x86_64.whl", hash = "sha256:067e3d7159a5d8f8a0b46ee11148fc35ca9b21f61e3c49fbd0a027450e65a33b", size = 6647922, upload-time = "2025-09-09T15:56:36.149Z" },
+    { url = "https://files.pythonhosted.org/packages/5d/f5/122d9cdb3f51c520d150fef6e87df9279e33d19a9611a87c0d2cf78a89f4/numpy-2.3.3-cp312-cp312-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:1c02d0629d25d426585fb2e45a66154081b9fa677bc92a881ff1d216bc9919a8", size = 14281991, upload-time = "2025-09-09T15:56:40.548Z" },
+    { url = "https://files.pythonhosted.org/packages/51/64/7de3c91e821a2debf77c92962ea3fe6ac2bc45d0778c1cbe15d4fce2fd94/numpy-2.3.3-cp312-cp312-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:d9192da52b9745f7f0766531dcfa978b7763916f158bb63bdb8a1eca0068ab20", size = 16641643, upload-time = "2025-09-09T15:56:43.343Z" },
+    { url = "https://files.pythonhosted.org/packages/30/e4/961a5fa681502cd0d68907818b69f67542695b74e3ceaa513918103b7e80/numpy-2.3.3-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:cd7de500a5b66319db419dc3c345244404a164beae0d0937283b907d8152e6ea", size = 16056787, upload-time = "2025-09-09T15:56:46.141Z" },
+    { url = "https://files.pythonhosted.org/packages/99/26/92c912b966e47fbbdf2ad556cb17e3a3088e2e1292b9833be1dfa5361a1a/numpy-2.3.3-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:93d4962d8f82af58f0b2eb85daaf1b3ca23fe0a85d0be8f1f2b7bb46034e56d7", size = 18579598, upload-time = "2025-09-09T15:56:49.844Z" },
+    { url = "https://files.pythonhosted.org/packages/17/b6/fc8f82cb3520768718834f310c37d96380d9dc61bfdaf05fe5c0b7653e01/numpy-2.3.3-cp312-cp312-win32.whl", hash = "sha256:5534ed6b92f9b7dca6c0a19d6df12d41c68b991cef051d108f6dbff3babc4ebf", size = 6320800, upload-time = "2025-09-09T15:56:52.499Z" },
+    { url = "https://files.pythonhosted.org/packages/32/ee/de999f2625b80d043d6d2d628c07d0d5555a677a3cf78fdf868d409b8766/numpy-2.3.3-cp312-cp312-win_amd64.whl", hash = "sha256:497d7cad08e7092dba36e3d296fe4c97708c93daf26643a1ae4b03f6294d30eb", size = 12786615, upload-time = "2025-09-09T15:56:54.422Z" },
+    { url = "https://files.pythonhosted.org/packages/49/6e/b479032f8a43559c383acb20816644f5f91c88f633d9271ee84f3b3a996c/numpy-2.3.3-cp312-cp312-win_arm64.whl", hash = "sha256:ca0309a18d4dfea6fc6262a66d06c26cfe4640c3926ceec90e57791a82b6eee5", size = 10195936, upload-time = "2025-09-09T15:56:56.541Z" },
+    { url = "https://files.pythonhosted.org/packages/7d/b9/984c2b1ee61a8b803bf63582b4ac4242cf76e2dbd663efeafcb620cc0ccb/numpy-2.3.3-cp313-cp313-macosx_10_13_x86_64.whl", hash = "sha256:f5415fb78995644253370985342cd03572ef8620b934da27d77377a2285955bf", size = 20949588, upload-time = "2025-09-09T15:56:59.087Z" },
+    { url = "https://files.pythonhosted.org/packages/a6/e4/07970e3bed0b1384d22af1e9912527ecbeb47d3b26e9b6a3bced068b3bea/numpy-2.3.3-cp313-cp313-macosx_11_0_arm64.whl", hash = "sha256:d00de139a3324e26ed5b95870ce63be7ec7352171bc69a4cf1f157a48e3eb6b7", size = 14177802, upload-time = "2025-09-09T15:57:01.73Z" },
+    { url = "https://files.pythonhosted.org/packages/35/c7/477a83887f9de61f1203bad89cf208b7c19cc9fef0cebef65d5a1a0619f2/numpy-2.3.3-cp313-cp313-macosx_14_0_arm64.whl", hash = "sha256:9dc13c6a5829610cc07422bc74d3ac083bd8323f14e2827d992f9e52e22cd6a6", size = 5106537, upload-time = "2025-09-09T15:57:03.765Z" },
+    { url = "https://files.pythonhosted.org/packages/52/47/93b953bd5866a6f6986344d045a207d3f1cfbad99db29f534ea9cee5108c/numpy-2.3.3-cp313-cp313-macosx_14_0_x86_64.whl", hash = "sha256:d79715d95f1894771eb4e60fb23f065663b2298f7d22945d66877aadf33d00c7", size = 6640743, upload-time = "2025-09-09T15:57:07.921Z" },
+    { url = "https://files.pythonhosted.org/packages/23/83/377f84aaeb800b64c0ef4de58b08769e782edcefa4fea712910b6f0afd3c/numpy-2.3.3-cp313-cp313-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:952cfd0748514ea7c3afc729a0fc639e61655ce4c55ab9acfab14bda4f402b4c", size = 14278881, upload-time = "2025-09-09T15:57:11.349Z" },
+    { url = "https://files.pythonhosted.org/packages/9a/a5/bf3db6e66c4b160d6ea10b534c381a1955dfab34cb1017ea93aa33c70ed3/numpy-2.3.3-cp313-cp313-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:5b83648633d46f77039c29078751f80da65aa64d5622a3cd62aaef9d835b6c93", size = 16636301, upload-time = "2025-09-09T15:57:14.245Z" },
+    { url = "https://files.pythonhosted.org/packages/a2/59/1287924242eb4fa3f9b3a2c30400f2e17eb2707020d1c5e3086fe7330717/numpy-2.3.3-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:b001bae8cea1c7dfdb2ae2b017ed0a6f2102d7a70059df1e338e307a4c78a8ae", size = 16053645, upload-time = "2025-09-09T15:57:16.534Z" },
+    { url = "https://files.pythonhosted.org/packages/e6/93/b3d47ed882027c35e94ac2320c37e452a549f582a5e801f2d34b56973c97/numpy-2.3.3-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:8e9aced64054739037d42fb84c54dd38b81ee238816c948c8f3ed134665dcd86", size = 18578179, upload-time = "2025-09-09T15:57:18.883Z" },
+    { url = "https://files.pythonhosted.org/packages/20/d9/487a2bccbf7cc9d4bfc5f0f197761a5ef27ba870f1e3bbb9afc4bbe3fcc2/numpy-2.3.3-cp313-cp313-win32.whl", hash = "sha256:9591e1221db3f37751e6442850429b3aabf7026d3b05542d102944ca7f00c8a8", size = 6312250, upload-time = "2025-09-09T15:57:21.296Z" },
+    { url = "https://files.pythonhosted.org/packages/1b/b5/263ebbbbcede85028f30047eab3d58028d7ebe389d6493fc95ae66c636ab/numpy-2.3.3-cp313-cp313-win_amd64.whl", hash = "sha256:f0dadeb302887f07431910f67a14d57209ed91130be0adea2f9793f1a4f817cf", size = 12783269, upload-time = "2025-09-09T15:57:23.034Z" },
+    { url = "https://files.pythonhosted.org/packages/fa/75/67b8ca554bbeaaeb3fac2e8bce46967a5a06544c9108ec0cf5cece559b6c/numpy-2.3.3-cp313-cp313-win_arm64.whl", hash = "sha256:3c7cf302ac6e0b76a64c4aecf1a09e51abd9b01fc7feee80f6c43e3ab1b1dbc5", size = 10195314, upload-time = "2025-09-09T15:57:25.045Z" },
+    { url = "https://files.pythonhosted.org/packages/11/d0/0d1ddec56b162042ddfafeeb293bac672de9b0cfd688383590090963720a/numpy-2.3.3-cp313-cp313t-macosx_10_13_x86_64.whl", hash = "sha256:eda59e44957d272846bb407aad19f89dc6f58fecf3504bd144f4c5cf81a7eacc", size = 21048025, upload-time = "2025-09-09T15:57:27.257Z" },
+    { url = "https://files.pythonhosted.org/packages/36/9e/1996ca6b6d00415b6acbdd3c42f7f03ea256e2c3f158f80bd7436a8a19f3/numpy-2.3.3-cp313-cp313t-macosx_11_0_arm64.whl", hash = "sha256:823d04112bc85ef5c4fda73ba24e6096c8f869931405a80aa8b0e604510a26bc", size = 14301053, upload-time = "2025-09-09T15:57:30.077Z" },
+    { url = "https://files.pythonhosted.org/packages/05/24/43da09aa764c68694b76e84b3d3f0c44cb7c18cdc1ba80e48b0ac1d2cd39/numpy-2.3.3-cp313-cp313t-macosx_14_0_arm64.whl", hash = "sha256:40051003e03db4041aa325da2a0971ba41cf65714e65d296397cc0e32de6018b", size = 5229444, upload-time = "2025-09-09T15:57:32.733Z" },
+    { url = "https://files.pythonhosted.org/packages/bc/14/50ffb0f22f7218ef8af28dd089f79f68289a7a05a208db9a2c5dcbe123c1/numpy-2.3.3-cp313-cp313t-macosx_14_0_x86_64.whl", hash = "sha256:6ee9086235dd6ab7ae75aba5662f582a81ced49f0f1c6de4260a78d8f2d91a19", size = 6738039, upload-time = "2025-09-09T15:57:34.328Z" },
+    { url = "https://files.pythonhosted.org/packages/55/52/af46ac0795e09657d45a7f4db961917314377edecf66db0e39fa7ab5c3d3/numpy-2.3.3-cp313-cp313t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:94fcaa68757c3e2e668ddadeaa86ab05499a70725811e582b6a9858dd472fb30", size = 14352314, upload-time = "2025-09-09T15:57:36.255Z" },
+    { url = "https://files.pythonhosted.org/packages/a7/b1/dc226b4c90eb9f07a3fff95c2f0db3268e2e54e5cce97c4ac91518aee71b/numpy-2.3.3-cp313-cp313t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:da1a74b90e7483d6ce5244053399a614b1d6b7bc30a60d2f570e5071f8959d3e", size = 16701722, upload-time = "2025-09-09T15:57:38.622Z" },
+    { url = "https://files.pythonhosted.org/packages/9d/9d/9d8d358f2eb5eced14dba99f110d83b5cd9a4460895230f3b396ad19a323/numpy-2.3.3-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:2990adf06d1ecee3b3dcbb4977dfab6e9f09807598d647f04d385d29e7a3c3d3", size = 16132755, upload-time = "2025-09-09T15:57:41.16Z" },
+    { url = "https://files.pythonhosted.org/packages/b6/27/b3922660c45513f9377b3fb42240bec63f203c71416093476ec9aa0719dc/numpy-2.3.3-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:ed635ff692483b8e3f0fcaa8e7eb8a75ee71aa6d975388224f70821421800cea", size = 18651560, upload-time = "2025-09-09T15:57:43.459Z" },
+    { url = "https://files.pythonhosted.org/packages/5b/8e/3ab61a730bdbbc201bb245a71102aa609f0008b9ed15255500a99cd7f780/numpy-2.3.3-cp313-cp313t-win32.whl", hash = "sha256:a333b4ed33d8dc2b373cc955ca57babc00cd6f9009991d9edc5ddbc1bac36bcd", size = 6442776, upload-time = "2025-09-09T15:57:45.793Z" },
+    { url = "https://files.pythonhosted.org/packages/1c/3a/e22b766b11f6030dc2decdeff5c2fb1610768055603f9f3be88b6d192fb2/numpy-2.3.3-cp313-cp313t-win_amd64.whl", hash = "sha256:4384a169c4d8f97195980815d6fcad04933a7e1ab3b530921c3fef7a1c63426d", size = 12927281, upload-time = "2025-09-09T15:57:47.492Z" },
+    { url = "https://files.pythonhosted.org/packages/7b/42/c2e2bc48c5e9b2a83423f99733950fbefd86f165b468a3d85d52b30bf782/numpy-2.3.3-cp313-cp313t-win_arm64.whl", hash = "sha256:75370986cc0bc66f4ce5110ad35aae6d182cc4ce6433c40ad151f53690130bf1", size = 10265275, upload-time = "2025-09-09T15:57:49.647Z" },
+    { url = "https://files.pythonhosted.org/packages/6b/01/342ad585ad82419b99bcf7cebe99e61da6bedb89e213c5fd71acc467faee/numpy-2.3.3-cp314-cp314-macosx_10_13_x86_64.whl", hash = "sha256:cd052f1fa6a78dee696b58a914b7229ecfa41f0a6d96dc663c1220a55e137593", size = 20951527, upload-time = "2025-09-09T15:57:52.006Z" },
+    { url = "https://files.pythonhosted.org/packages/ef/d8/204e0d73fc1b7a9ee80ab1fe1983dd33a4d64a4e30a05364b0208e9a241a/numpy-2.3.3-cp314-cp314-macosx_11_0_arm64.whl", hash = "sha256:414a97499480067d305fcac9716c29cf4d0d76db6ebf0bf3cbce666677f12652", size = 14186159, upload-time = "2025-09-09T15:57:54.407Z" },
+    { url = "https://files.pythonhosted.org/packages/22/af/f11c916d08f3a18fb8ba81ab72b5b74a6e42ead4c2846d270eb19845bf74/numpy-2.3.3-cp314-cp314-macosx_14_0_arm64.whl", hash = "sha256:50a5fe69f135f88a2be9b6ca0481a68a136f6febe1916e4920e12f1a34e708a7", size = 5114624, upload-time = "2025-09-09T15:57:56.5Z" },
+    { url = "https://files.pythonhosted.org/packages/fb/11/0ed919c8381ac9d2ffacd63fd1f0c34d27e99cab650f0eb6f110e6ae4858/numpy-2.3.3-cp314-cp314-macosx_14_0_x86_64.whl", hash = "sha256:b912f2ed2b67a129e6a601e9d93d4fa37bef67e54cac442a2f588a54afe5c67a", size = 6642627, upload-time = "2025-09-09T15:57:58.206Z" },
+    { url = "https://files.pythonhosted.org/packages/ee/83/deb5f77cb0f7ba6cb52b91ed388b47f8f3c2e9930d4665c600408d9b90b9/numpy-2.3.3-cp314-cp314-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:9e318ee0596d76d4cb3d78535dc005fa60e5ea348cd131a51e99d0bdbe0b54fe", size = 14296926, upload-time = "2025-09-09T15:58:00.035Z" },
+    { url = "https://files.pythonhosted.org/packages/77/cc/70e59dcb84f2b005d4f306310ff0a892518cc0c8000a33d0e6faf7ca8d80/numpy-2.3.3-cp314-cp314-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:ce020080e4a52426202bdb6f7691c65bb55e49f261f31a8f506c9f6bc7450421", size = 16638958, upload-time = "2025-09-09T15:58:02.738Z" },
+    { url = "https://files.pythonhosted.org/packages/b6/5a/b2ab6c18b4257e099587d5b7f903317bd7115333ad8d4ec4874278eafa61/numpy-2.3.3-cp314-cp314-musllinux_1_2_aarch64.whl", hash = "sha256:e6687dc183aa55dae4a705b35f9c0f8cb178bcaa2f029b241ac5356221d5c021", size = 16071920, upload-time = "2025-09-09T15:58:05.029Z" },
+    { url = "https://files.pythonhosted.org/packages/b8/f1/8b3fdc44324a259298520dd82147ff648979bed085feeacc1250ef1656c0/numpy-2.3.3-cp314-cp314-musllinux_1_2_x86_64.whl", hash = "sha256:d8f3b1080782469fdc1718c4ed1d22549b5fb12af0d57d35e992158a772a37cf", size = 18577076, upload-time = "2025-09-09T15:58:07.745Z" },
+    { url = "https://files.pythonhosted.org/packages/f0/a1/b87a284fb15a42e9274e7fcea0dad259d12ddbf07c1595b26883151ca3b4/numpy-2.3.3-cp314-cp314-win32.whl", hash = "sha256:cb248499b0bc3be66ebd6578b83e5acacf1d6cb2a77f2248ce0e40fbec5a76d0", size = 6366952, upload-time = "2025-09-09T15:58:10.096Z" },
+    { url = "https://files.pythonhosted.org/packages/70/5f/1816f4d08f3b8f66576d8433a66f8fa35a5acfb3bbd0bf6c31183b003f3d/numpy-2.3.3-cp314-cp314-win_amd64.whl", hash = "sha256:691808c2b26b0f002a032c73255d0bd89751425f379f7bcd22d140db593a96e8", size = 12919322, upload-time = "2025-09-09T15:58:12.138Z" },
+    { url = "https://files.pythonhosted.org/packages/8c/de/072420342e46a8ea41c324a555fa90fcc11637583fb8df722936aed1736d/numpy-2.3.3-cp314-cp314-win_arm64.whl", hash = "sha256:9ad12e976ca7b10f1774b03615a2a4bab8addce37ecc77394d8e986927dc0dfe", size = 10478630, upload-time = "2025-09-09T15:58:14.64Z" },
+    { url = "https://files.pythonhosted.org/packages/d5/df/ee2f1c0a9de7347f14da5dd3cd3c3b034d1b8607ccb6883d7dd5c035d631/numpy-2.3.3-cp314-cp314t-macosx_10_13_x86_64.whl", hash = "sha256:9cc48e09feb11e1db00b320e9d30a4151f7369afb96bd0e48d942d09da3a0d00", size = 21047987, upload-time = "2025-09-09T15:58:16.889Z" },
+    { url = "https://files.pythonhosted.org/packages/d6/92/9453bdc5a4e9e69cf4358463f25e8260e2ffc126d52e10038b9077815989/numpy-2.3.3-cp314-cp314t-macosx_11_0_arm64.whl", hash = "sha256:901bf6123879b7f251d3631967fd574690734236075082078e0571977c6a8e6a", size = 14301076, upload-time = "2025-09-09T15:58:20.343Z" },
+    { url = "https://files.pythonhosted.org/packages/13/77/1447b9eb500f028bb44253105bd67534af60499588a5149a94f18f2ca917/numpy-2.3.3-cp314-cp314t-macosx_14_0_arm64.whl", hash = "sha256:7f025652034199c301049296b59fa7d52c7e625017cae4c75d8662e377bf487d", size = 5229491, upload-time = "2025-09-09T15:58:22.481Z" },
+    { url = "https://files.pythonhosted.org/packages/3d/f9/d72221b6ca205f9736cb4b2ce3b002f6e45cd67cd6a6d1c8af11a2f0b649/numpy-2.3.3-cp314-cp314t-macosx_14_0_x86_64.whl", hash = "sha256:533ca5f6d325c80b6007d4d7fb1984c303553534191024ec6a524a4c92a5935a", size = 6737913, upload-time = "2025-09-09T15:58:24.569Z" },
+    { url = "https://files.pythonhosted.org/packages/3c/5f/d12834711962ad9c46af72f79bb31e73e416ee49d17f4c797f72c96b6ca5/numpy-2.3.3-cp314-cp314t-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:0edd58682a399824633b66885d699d7de982800053acf20be1eaa46d92009c54", size = 14352811, upload-time = "2025-09-09T15:58:26.416Z" },
+    { url = "https://files.pythonhosted.org/packages/a1/0d/fdbec6629d97fd1bebed56cd742884e4eead593611bbe1abc3eb40d304b2/numpy-2.3.3-cp314-cp314t-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:367ad5d8fbec5d9296d18478804a530f1191e24ab4d75ab408346ae88045d25e", size = 16702689, upload-time = "2025-09-09T15:58:28.831Z" },
+    { url = "https://files.pythonhosted.org/packages/9b/09/0a35196dc5575adde1eb97ddfbc3e1687a814f905377621d18ca9bc2b7dd/numpy-2.3.3-cp314-cp314t-musllinux_1_2_aarch64.whl", hash = "sha256:8f6ac61a217437946a1fa48d24c47c91a0c4f725237871117dea264982128097", size = 16133855, upload-time = "2025-09-09T15:58:31.349Z" },
+    { url = "https://files.pythonhosted.org/packages/7a/ca/c9de3ea397d576f1b6753eaa906d4cdef1bf97589a6d9825a349b4729cc2/numpy-2.3.3-cp314-cp314t-musllinux_1_2_x86_64.whl", hash = "sha256:179a42101b845a816d464b6fe9a845dfaf308fdfc7925387195570789bb2c970", size = 18652520, upload-time = "2025-09-09T15:58:33.762Z" },
+    { url = "https://files.pythonhosted.org/packages/fd/c2/e5ed830e08cd0196351db55db82f65bc0ab05da6ef2b72a836dcf1936d2f/numpy-2.3.3-cp314-cp314t-win32.whl", hash = "sha256:1250c5d3d2562ec4174bce2e3a1523041595f9b651065e4a4473f5f48a6bc8a5", size = 6515371, upload-time = "2025-09-09T15:58:36.04Z" },
+    { url = "https://files.pythonhosted.org/packages/47/c7/b0f6b5b67f6788a0725f744496badbb604d226bf233ba716683ebb47b570/numpy-2.3.3-cp314-cp314t-win_amd64.whl", hash = "sha256:b37a0b2e5935409daebe82c1e42274d30d9dd355852529eab91dab8dcca7419f", size = 13112576, upload-time = "2025-09-09T15:58:37.927Z" },
+    { url = "https://files.pythonhosted.org/packages/06/b9/33bba5ff6fb679aa0b1f8a07e853f002a6b04b9394db3069a1270a7784ca/numpy-2.3.3-cp314-cp314t-win_arm64.whl", hash = "sha256:78c9f6560dc7e6b3990e32df7ea1a50bbd0e2a111e05209963f5ddcab7073b0b", size = 10545953, upload-time = "2025-09-09T15:58:40.576Z" },
+    { url = "https://files.pythonhosted.org/packages/b8/f2/7e0a37cfced2644c9563c529f29fa28acbd0960dde32ece683aafa6f4949/numpy-2.3.3-pp311-pypy311_pp73-macosx_10_15_x86_64.whl", hash = "sha256:1e02c7159791cd481e1e6d5ddd766b62a4d5acf8df4d4d1afe35ee9c5c33a41e", size = 21131019, upload-time = "2025-09-09T15:58:42.838Z" },
+    { url = "https://files.pythonhosted.org/packages/1a/7e/3291f505297ed63831135a6cc0f474da0c868a1f31b0dd9a9f03a7a0d2ed/numpy-2.3.3-pp311-pypy311_pp73-macosx_11_0_arm64.whl", hash = "sha256:dca2d0fc80b3893ae72197b39f69d55a3cd8b17ea1b50aa4c62de82419936150", size = 14376288, upload-time = "2025-09-09T15:58:45.425Z" },
+    { url = "https://files.pythonhosted.org/packages/bf/4b/ae02e985bdeee73d7b5abdefeb98aef1207e96d4c0621ee0cf228ddfac3c/numpy-2.3.3-pp311-pypy311_pp73-macosx_14_0_arm64.whl", hash = "sha256:99683cbe0658f8271b333a1b1b4bb3173750ad59c0c61f5bbdc5b318918fffe3", size = 5305425, upload-time = "2025-09-09T15:58:48.6Z" },
+    { url = "https://files.pythonhosted.org/packages/8b/eb/9df215d6d7250db32007941500dc51c48190be25f2401d5b2b564e467247/numpy-2.3.3-pp311-pypy311_pp73-macosx_14_0_x86_64.whl", hash = "sha256:d9d537a39cc9de668e5cd0e25affb17aec17b577c6b3ae8a3d866b479fbe88d0", size = 6819053, upload-time = "2025-09-09T15:58:50.401Z" },
+    { url = "https://files.pythonhosted.org/packages/57/62/208293d7d6b2a8998a4a1f23ac758648c3c32182d4ce4346062018362e29/numpy-2.3.3-pp311-pypy311_pp73-manylinux_2_27_aarch64.manylinux_2_28_aarch64.whl", hash = "sha256:8596ba2f8af5f93b01d97563832686d20206d303024777f6dfc2e7c7c3f1850e", size = 14420354, upload-time = "2025-09-09T15:58:52.704Z" },
+    { url = "https://files.pythonhosted.org/packages/ed/0c/8e86e0ff7072e14a71b4c6af63175e40d1e7e933ce9b9e9f765a95b4e0c3/numpy-2.3.3-pp311-pypy311_pp73-manylinux_2_27_x86_64.manylinux_2_28_x86_64.whl", hash = "sha256:e1ec5615b05369925bd1125f27df33f3b6c8bc10d788d5999ecd8769a1fa04db", size = 16760413, upload-time = "2025-09-09T15:58:55.027Z" },
+    { url = "https://files.pythonhosted.org/packages/af/11/0cc63f9f321ccf63886ac203336777140011fb669e739da36d8db3c53b98/numpy-2.3.3-pp311-pypy311_pp73-win_amd64.whl", hash = "sha256:2e267c7da5bf7309670523896df97f93f6e469fb931161f483cd6882b3b1a5dc", size = 12971844, upload-time = "2025-09-09T15:58:57.359Z" },
 ]
 
 [[package]]
@@ -1835,6 +1888,42 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/5a/dd/464bd739bacb3b745a1c93bc15f20f0b1e27f0a64ec693367794b398673b/psycopg_binary-3.2.10-cp314-cp314-win_amd64.whl", hash = "sha256:d5c6a66a76022af41970bf19f51bc6bf87bd10165783dd1d40484bfd87d6b382", size = 2973554, upload-time = "2025-09-08T09:12:05.884Z" },
 ]
 
+[[package]]
+name = "pyarrow"
+version = "21.0.0"
+source = { registry = "https://pypi.org/simple" }
+sdist = { url = "https://files.pythonhosted.org/packages/ef/c2/ea068b8f00905c06329a3dfcd40d0fcc2b7d0f2e355bdb25b65e0a0e4cd4/pyarrow-21.0.0.tar.gz", hash = "sha256:5051f2dccf0e283ff56335760cbc8622cf52264d67e359d5569541ac11b6d5bc", size = 1133487, upload-time = "2025-07-18T00:57:31.761Z" }
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/94/dc/80564a3071a57c20b7c32575e4a0120e8a330ef487c319b122942d665960/pyarrow-21.0.0-cp311-cp311-macosx_12_0_arm64.whl", hash = "sha256:c077f48aab61738c237802836fc3844f85409a46015635198761b0d6a688f87b", size = 31243234, upload-time = "2025-07-18T00:55:03.812Z" },
+    { url = "https://files.pythonhosted.org/packages/ea/cc/3b51cb2db26fe535d14f74cab4c79b191ed9a8cd4cbba45e2379b5ca2746/pyarrow-21.0.0-cp311-cp311-macosx_12_0_x86_64.whl", hash = "sha256:689f448066781856237eca8d1975b98cace19b8dd2ab6145bf49475478bcaa10", size = 32714370, upload-time = "2025-07-18T00:55:07.495Z" },
+    { url = "https://files.pythonhosted.org/packages/24/11/a4431f36d5ad7d83b87146f515c063e4d07ef0b7240876ddb885e6b44f2e/pyarrow-21.0.0-cp311-cp311-manylinux_2_28_aarch64.whl", hash = "sha256:479ee41399fcddc46159a551705b89c05f11e8b8cb8e968f7fec64f62d91985e", size = 41135424, upload-time = "2025-07-18T00:55:11.461Z" },
+    { url = "https://files.pythonhosted.org/packages/74/dc/035d54638fc5d2971cbf1e987ccd45f1091c83bcf747281cf6cc25e72c88/pyarrow-21.0.0-cp311-cp311-manylinux_2_28_x86_64.whl", hash = "sha256:40ebfcb54a4f11bcde86bc586cbd0272bac0d516cfa539c799c2453768477569", size = 42823810, upload-time = "2025-07-18T00:55:16.301Z" },
+    { url = "https://files.pythonhosted.org/packages/2e/3b/89fced102448a9e3e0d4dded1f37fa3ce4700f02cdb8665457fcc8015f5b/pyarrow-21.0.0-cp311-cp311-musllinux_1_2_aarch64.whl", hash = "sha256:8d58d8497814274d3d20214fbb24abcad2f7e351474357d552a8d53bce70c70e", size = 43391538, upload-time = "2025-07-18T00:55:23.82Z" },
+    { url = "https://files.pythonhosted.org/packages/fb/bb/ea7f1bd08978d39debd3b23611c293f64a642557e8141c80635d501e6d53/pyarrow-21.0.0-cp311-cp311-musllinux_1_2_x86_64.whl", hash = "sha256:585e7224f21124dd57836b1530ac8f2df2afc43c861d7bf3d58a4870c42ae36c", size = 45120056, upload-time = "2025-07-18T00:55:28.231Z" },
+    { url = "https://files.pythonhosted.org/packages/6e/0b/77ea0600009842b30ceebc3337639a7380cd946061b620ac1a2f3cb541e2/pyarrow-21.0.0-cp311-cp311-win_amd64.whl", hash = "sha256:555ca6935b2cbca2c0e932bedd853e9bc523098c39636de9ad4693b5b1df86d6", size = 26220568, upload-time = "2025-07-18T00:55:32.122Z" },
+    { url = "https://files.pythonhosted.org/packages/ca/d4/d4f817b21aacc30195cf6a46ba041dd1be827efa4a623cc8bf39a1c2a0c0/pyarrow-21.0.0-cp312-cp312-macosx_12_0_arm64.whl", hash = "sha256:3a302f0e0963db37e0a24a70c56cf91a4faa0bca51c23812279ca2e23481fccd", size = 31160305, upload-time = "2025-07-18T00:55:35.373Z" },
+    { url = "https://files.pythonhosted.org/packages/a2/9c/dcd38ce6e4b4d9a19e1d36914cb8e2b1da4e6003dd075474c4cfcdfe0601/pyarrow-21.0.0-cp312-cp312-macosx_12_0_x86_64.whl", hash = "sha256:b6b27cf01e243871390474a211a7922bfbe3bda21e39bc9160daf0da3fe48876", size = 32684264, upload-time = "2025-07-18T00:55:39.303Z" },
+    { url = "https://files.pythonhosted.org/packages/4f/74/2a2d9f8d7a59b639523454bec12dba35ae3d0a07d8ab529dc0809f74b23c/pyarrow-21.0.0-cp312-cp312-manylinux_2_28_aarch64.whl", hash = "sha256:e72a8ec6b868e258a2cd2672d91f2860ad532d590ce94cdf7d5e7ec674ccf03d", size = 41108099, upload-time = "2025-07-18T00:55:42.889Z" },
+    { url = "https://files.pythonhosted.org/packages/ad/90/2660332eeb31303c13b653ea566a9918484b6e4d6b9d2d46879a33ab0622/pyarrow-21.0.0-cp312-cp312-manylinux_2_28_x86_64.whl", hash = "sha256:b7ae0bbdc8c6674259b25bef5d2a1d6af5d39d7200c819cf99e07f7dfef1c51e", size = 42829529, upload-time = "2025-07-18T00:55:47.069Z" },
+    { url = "https://files.pythonhosted.org/packages/33/27/1a93a25c92717f6aa0fca06eb4700860577d016cd3ae51aad0e0488ac899/pyarrow-21.0.0-cp312-cp312-musllinux_1_2_aarch64.whl", hash = "sha256:58c30a1729f82d201627c173d91bd431db88ea74dcaa3885855bc6203e433b82", size = 43367883, upload-time = "2025-07-18T00:55:53.069Z" },
+    { url = "https://files.pythonhosted.org/packages/05/d9/4d09d919f35d599bc05c6950095e358c3e15148ead26292dfca1fb659b0c/pyarrow-21.0.0-cp312-cp312-musllinux_1_2_x86_64.whl", hash = "sha256:072116f65604b822a7f22945a7a6e581cfa28e3454fdcc6939d4ff6090126623", size = 45133802, upload-time = "2025-07-18T00:55:57.714Z" },
+    { url = "https://files.pythonhosted.org/packages/71/30/f3795b6e192c3ab881325ffe172e526499eb3780e306a15103a2764916a2/pyarrow-21.0.0-cp312-cp312-win_amd64.whl", hash = "sha256:cf56ec8b0a5c8c9d7021d6fd754e688104f9ebebf1bf4449613c9531f5346a18", size = 26203175, upload-time = "2025-07-18T00:56:01.364Z" },
+    { url = "https://files.pythonhosted.org/packages/16/ca/c7eaa8e62db8fb37ce942b1ea0c6d7abfe3786ca193957afa25e71b81b66/pyarrow-21.0.0-cp313-cp313-macosx_12_0_arm64.whl", hash = "sha256:e99310a4ebd4479bcd1964dff9e14af33746300cb014aa4a3781738ac63baf4a", size = 31154306, upload-time = "2025-07-18T00:56:04.42Z" },
+    { url = "https://files.pythonhosted.org/packages/ce/e8/e87d9e3b2489302b3a1aea709aaca4b781c5252fcb812a17ab6275a9a484/pyarrow-21.0.0-cp313-cp313-macosx_12_0_x86_64.whl", hash = "sha256:d2fe8e7f3ce329a71b7ddd7498b3cfac0eeb200c2789bd840234f0dc271a8efe", size = 32680622, upload-time = "2025-07-18T00:56:07.505Z" },
+    { url = "https://files.pythonhosted.org/packages/84/52/79095d73a742aa0aba370c7942b1b655f598069489ab387fe47261a849e1/pyarrow-21.0.0-cp313-cp313-manylinux_2_28_aarch64.whl", hash = "sha256:f522e5709379d72fb3da7785aa489ff0bb87448a9dc5a75f45763a795a089ebd", size = 41104094, upload-time = "2025-07-18T00:56:10.994Z" },
+    { url = "https://files.pythonhosted.org/packages/89/4b/7782438b551dbb0468892a276b8c789b8bbdb25ea5c5eb27faadd753e037/pyarrow-21.0.0-cp313-cp313-manylinux_2_28_x86_64.whl", hash = "sha256:69cbbdf0631396e9925e048cfa5bce4e8c3d3b41562bbd70c685a8eb53a91e61", size = 42825576, upload-time = "2025-07-18T00:56:15.569Z" },
+    { url = "https://files.pythonhosted.org/packages/b3/62/0f29de6e0a1e33518dec92c65be0351d32d7ca351e51ec5f4f837a9aab91/pyarrow-21.0.0-cp313-cp313-musllinux_1_2_aarch64.whl", hash = "sha256:731c7022587006b755d0bdb27626a1a3bb004bb56b11fb30d98b6c1b4718579d", size = 43368342, upload-time = "2025-07-18T00:56:19.531Z" },
+    { url = "https://files.pythonhosted.org/packages/90/c7/0fa1f3f29cf75f339768cc698c8ad4ddd2481c1742e9741459911c9ac477/pyarrow-21.0.0-cp313-cp313-musllinux_1_2_x86_64.whl", hash = "sha256:dc56bc708f2d8ac71bd1dcb927e458c93cec10b98eb4120206a4091db7b67b99", size = 45131218, upload-time = "2025-07-18T00:56:23.347Z" },
+    { url = "https://files.pythonhosted.org/packages/01/63/581f2076465e67b23bc5a37d4a2abff8362d389d29d8105832e82c9c811c/pyarrow-21.0.0-cp313-cp313-win_amd64.whl", hash = "sha256:186aa00bca62139f75b7de8420f745f2af12941595bbbfa7ed3870ff63e25636", size = 26087551, upload-time = "2025-07-18T00:56:26.758Z" },
+    { url = "https://files.pythonhosted.org/packages/c9/ab/357d0d9648bb8241ee7348e564f2479d206ebe6e1c47ac5027c2e31ecd39/pyarrow-21.0.0-cp313-cp313t-macosx_12_0_arm64.whl", hash = "sha256:a7a102574faa3f421141a64c10216e078df467ab9576684d5cd696952546e2da", size = 31290064, upload-time = "2025-07-18T00:56:30.214Z" },
+    { url = "https://files.pythonhosted.org/packages/3f/8a/5685d62a990e4cac2043fc76b4661bf38d06efed55cf45a334b455bd2759/pyarrow-21.0.0-cp313-cp313t-macosx_12_0_x86_64.whl", hash = "sha256:1e005378c4a2c6db3ada3ad4c217b381f6c886f0a80d6a316fe586b90f77efd7", size = 32727837, upload-time = "2025-07-18T00:56:33.935Z" },
+    { url = "https://files.pythonhosted.org/packages/fc/de/c0828ee09525c2bafefd3e736a248ebe764d07d0fd762d4f0929dbc516c9/pyarrow-21.0.0-cp313-cp313t-manylinux_2_28_aarch64.whl", hash = "sha256:65f8e85f79031449ec8706b74504a316805217b35b6099155dd7e227eef0d4b6", size = 41014158, upload-time = "2025-07-18T00:56:37.528Z" },
+    { url = "https://files.pythonhosted.org/packages/6e/26/a2865c420c50b7a3748320b614f3484bfcde8347b2639b2b903b21ce6a72/pyarrow-21.0.0-cp313-cp313t-manylinux_2_28_x86_64.whl", hash = "sha256:3a81486adc665c7eb1a2bde0224cfca6ceaba344a82a971ef059678417880eb8", size = 42667885, upload-time = "2025-07-18T00:56:41.483Z" },
+    { url = "https://files.pythonhosted.org/packages/0a/f9/4ee798dc902533159250fb4321267730bc0a107d8c6889e07c3add4fe3a5/pyarrow-21.0.0-cp313-cp313t-musllinux_1_2_aarch64.whl", hash = "sha256:fc0d2f88b81dcf3ccf9a6ae17f89183762c8a94a5bdcfa09e05cfe413acf0503", size = 43276625, upload-time = "2025-07-18T00:56:48.002Z" },
+    { url = "https://files.pythonhosted.org/packages/5a/da/e02544d6997037a4b0d22d8e5f66bc9315c3671371a8b18c79ade1cefe14/pyarrow-21.0.0-cp313-cp313t-musllinux_1_2_x86_64.whl", hash = "sha256:6299449adf89df38537837487a4f8d3bd91ec94354fdd2a7d30bc11c48ef6e79", size = 44951890, upload-time = "2025-07-18T00:56:52.568Z" },
+    { url = "https://files.pythonhosted.org/packages/e5/4e/519c1bc1876625fe6b71e9a28287c43ec2f20f73c658b9ae1d485c0c206e/pyarrow-21.0.0-cp313-cp313t-win_amd64.whl", hash = "sha256:222c39e2c70113543982c6b34f3077962b44fca38c0bd9e68bb6781534425c10", size = 26371006, upload-time = "2025-07-18T00:56:56.379Z" },
+]
+
 [[package]]
 name = "pycparser"
 version = "2.23"
@@ -1960,6 +2049,24 @@ wheels = [
     { url = "https://files.pythonhosted.org/packages/c7/21/705964c7812476f378728bdf590ca4b771ec72385c533964653c68e86bdc/pygments-2.19.2-py3-none-any.whl", hash = "sha256:86540386c03d588bb81d44bc3928634ff26449851e99741617ecb9037ee5ec0b", size = 1225217, upload-time = "2025-06-21T13:39:07.939Z" },
 ]
 
+[[package]]
+name = "pylance"
+version = "0.36.0"
+source = { registry = "https://pypi.org/simple" }
+dependencies = [
+    { name = "numpy" },
+    { name = "pyarrow" },
+]
+wheels = [
+    { url = "https://files.pythonhosted.org/packages/09/13/f7f029d12a3dfdc9f3059d77b3999d40f9cc064ba85fef885a08bf65dcb2/pylance-0.36.0-cp39-abi3-macosx_10_15_x86_64.whl", hash = "sha256:160ed088dc5fb63a71c8c96640d43ea58464f64bca8aa23b0337b1a96fd47b79", size = 43403867, upload-time = "2025-09-12T20:29:25.507Z" },
+    { url = "https://files.pythonhosted.org/packages/95/95/defad18786260653b33d5ef8223736c0e481861c8d33311756bd471468ad/pylance-0.36.0-cp39-abi3-macosx_11_0_arm64.whl", hash = "sha256:ce43ad002b4e67ffb1a33925d05d472bbde77c57a5e84aca1728faa9ace0c086", size = 39777498, upload-time = "2025-09-12T20:27:02.906Z" },
+    { url = "https://files.pythonhosted.org/packages/19/33/7080ed4e45648d8c803a49cd5a206eb95176ef9dc06bff26748ec2109c65/pylance-0.36.0-cp39-abi3-manylinux_2_17_aarch64.manylinux2014_aarch64.whl", hash = "sha256:6ad7b168b0d4b7864be6040bebaf6d9a3959e76a190ff401a84b165b75eade96", size = 41819489, upload-time = "2025-09-12T20:17:06.37Z" },
+    { url = "https://files.pythonhosted.org/packages/29/9a/0c572994d96e03e70481dafb2b062033a9ce24beb5ac6045f00f013ca57c/pylance-0.36.0-cp39-abi3-manylinux_2_17_x86_64.manylinux2014_x86_64.whl", hash = "sha256:353deeb7b19be505db490258b5f2fc897efd4a45255fa0d51455662e01ad59ab", size = 45366480, upload-time = "2025-09-12T20:19:53.924Z" },
+    { url = "https://files.pythonhosted.org/packages/fe/82/a74f0436b6a983c2798d1f44699352cd98c42bc335781ece98a878cf63fb/pylance-0.36.0-cp39-abi3-manylinux_2_28_aarch64.whl", hash = "sha256:9cd963fc22257591d1daf281fa2369e05299d78950cb11980aa099d7cbacdf00", size = 41833322, upload-time = "2025-09-12T20:17:40.784Z" },
+    { url = "https://files.pythonhosted.org/packages/a8/f2/d28fa3487992c3bd46af6838da13cf9a00be24fcf4cf928f77feec52d8d6/pylance-0.36.0-cp39-abi3-manylinux_2_28_x86_64.whl", hash = "sha256:40117569a87379e08ed12eccac658999158f81df946f2ed02693b77776b57597", size = 45347065, upload-time = "2025-09-12T20:19:26.435Z" },
+    { url = "https://files.pythonhosted.org/packages/ff/ab/e7fc302950f1c6815a6e832d052d0860130374bfe4bd482b075299dc8384/pylance-0.36.0-cp39-abi3-win_amd64.whl", hash = "sha256:a2930738192e5075220bc38c8a58ff4e48a71d53b3ca2a577ffce0318609cac0", size = 46348996, upload-time = "2025-09-12T20:36:04.663Z" },
+]
+
 [[package]]
 name = "pyrefly"
 version = "0.33.0"