OpenSearch

OpenSearch is a critical component in our Universe ecosystem, used by several key services:

Service	OpenSearch Usage
Integrates	Vulnerability search, code lines, packages, ports, roots
Sifts	Code analysis and similar vulnerability search
Streams	Processing DynamoDB events to OpenSearch

OpenSearch Architecture

OpenSearch Domains

integrates Domain
- Version: OpenSearch 2.19
- Configuration: 3 dedicated master nodes + 3 data nodes
- Instance: r6gd.large.search (instances with NVMe storage)
- Log group: opensearch (retention: 90 days)
sifts Domain
- Version: OpenSearch 2.15
- Configuration: 3 dedicated master nodes + 3 data nodes
- Instance: r6gd.large.search
- Log group: sifts-opensearch (retention: 90 days)

Logs Configuration

Configured log types

Log Type	Integrates	Sifts	Description
`INDEX_SLOW_LOGS`	❌ Disabled	❌ Disabled	Slow indexing logs
`SEARCH_SLOW_LOGS`	✅ Enabled	❌ Disabled	Slow search logs
`ES_APPLICATION_LOGS`	✅ Enabled	✅ Enabled	General application logs

Main Indices

Integrates:

vulns_index - Vulnerabilities
findings_index - Findings
lines_index - Code lines
packages_index - Packages
ports_index - Ports
roots_index - Code roots
inputs_index - User inputs
events_index - System events
executions_index - Executions

Sifts:

vulnerabilities_candidates_v1 - Vulnerability candidates for analysis
pkgs_index - Packages for analysis

Monitoring Strategies with CloudWatch

Application Logs

Location: CloudWatch → Logs → Log groups → opensearch or sifts-opensearch

Useful queries:

# General errors 
fields @timestamp, @message
| filter @message like /ERROR/
| sort @timestamp desc
| limit 100

# Connection errors 
fields @timestamp, @message
| filter @message like /ConnectionError|connection.*failed|timeout/
| sort @timestamp desc
| limit 50

# Cluster errors 
fields @timestamp, @message
| filter @message like /cluster.*error|node.*failed|shard.*failed/
| sort @timestamp desc
| limit 50

Slow Search Logs - Integrates Only

Useful queries:

# Slow searches 
fields @timestamp, @message
| filter @message like /took\[[0-9]+ms\], took_millis\[[0-9]+\]/
| sort @timestamp desc
| limit 100

OpenSearch Metrics

Key metrics in CloudWatch (AWS/ES namespace):

ClusterStatus - Cluster status (green, yellow, red)
CPUUtilization - CPU usage
FreeStorageSpace - Free space
SearchLatency - Search latency
IndexingLatency - Indexing latency
JVMMemoryPressure - JVM memory pressure

How to visualize:

CloudWatch → Metrics → All Metrics
Filter by AWS/ES
Select Per-Domain, Per-Client Metrics
Filter by DomainName: integrates or sifts
Select relevant metrics
Group by ClientId

Debugging Common Issues:

No Results in Searches:

Check application logs

fields @timestamp, @message
| filter @message like /search.*error|no.*results|zero.*results/
| sort @timestamp desc
| limit 20

Check streams logs (indexing)

Navigate to: CloudWatch → Logs → Log groups → /aws/lambda/integrates_streams_*.
Look for errors in specific index processors:

fields @timestamp, @message
| filter @message like /indexing.*failed|BulkIndexError/
| sort @timestamp desc

Check indexing metrics

Review IndexingRate and IndexingLatency.
Check for recent drops in the indexing rate.

Check cluster status

Verify ClusterStatus (red indicates serious problems).
Review ShardAllocationStatus if available.

Indexing Errors from DynamoDB Streams:

Check Lambda streams logs

# In log group /aws/lambda/integrates_streams_*
fields @timestamp, @message
| filter @message like /Error|Exception|failed/
| parse @message "Error * - */ as errorType, errorMessage
| sort @timestamp desc
| limit 50

Check specific bulk operation errors

fields @timestamp, @message
| filter @message like /BulkIndexError|bulk.*error/
| sort @timestamp desc

Check Streams application logs

fields @timestamp, @message
| filter @message like /bulk.*rejected|EsRejectedExecutionException/
| sort @timestamp desc

Connectivity Issues:

Check Lambda streams logs

# In log group /aws/lambda/integrates_streams_*
fields @timestamp, @message
| filter @message like /Error|Exception|failed/
| parse @message "Error * - */ as errorType, errorMessage
| sort @timestamp desc
| limit 50

Check specific bulk operation errors

fields @timestamp, @message
| filter @message like /BulkIndexError|bulk.*error/
| sort @timestamp desc

Check Streams application logs

fields @timestamp, @message
| filter @message like /bulk.*rejected|EsRejectedExecutionException/
| sort @timestamp desc

OpenSearch

OpenSearch

OpenSearch Architecture

OpenSearch Domains

integrates Domain

sifts Domain

Logs Configuration

Configured log types

Main Indices

Monitoring Strategies with CloudWatch