docs/snippets/r/ocr/ocr_extraction.md

```r title="R"
library(kreuzberg)

# Configure Tesseract OCR
config <- list(
  force_ocr = TRUE,
  ocr = list(backend = "tesseract", language = "eng")
)

# Extract text from a scanned image
json <- extract_file_sync("scan.png", "image/png", config)
result <- jsonlite::fromJSON(json, simplifyVector = FALSE)

cat(sprintf("Extracted %d characters\n", nchar(result$content)))
cat("Content preview:\n")
cat(substr(result$content, 1, 200))
```
Nomad changes 2026-06-01 23:40:55 +02:00			```r title="R"
			`library(kreuzberg)`

			`# Configure Tesseract OCR`
			`config <- list(`
			`force_ocr = TRUE,`
			`ocr = list(backend = "tesseract", language = "eng")`
			`)`

			`# Extract text from a scanned image`
			`json <- extract_file_sync("scan.png", "image/png", config)`
			`result <- jsonlite::fromJSON(json, simplifyVector = FALSE)`

			`cat(sprintf("Extracted %d characters\n", nchar(result$content)))`
			`cat("Content preview:\n")`
			`cat(substr(result$content, 1, 200))`
			```